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Python 语言 从 20 世纪 90 年 代 初 诞生 至 今 ， 逐 渐 被 广泛 应 用 于 处 理 系 统管 理 任务 和 科 
学 计算 ， 是 最 受 欢 迎 的 程序 设计 语言 之 一 。 

学 习 编 程 是 工程 专业 学 生 学 习 的 重要 部 分 ， 除 了 直接 应 用 外 ， 学 习 编程 是 了 解 计算 机 
科学 本 质 的 方法 。 计 算 机 科学 对 现代 社会 产生 了 毋庸 置疑 的 影响 。Python 是 新 兴 的 程序 设 
计 语 言 ， 是 一 种 解释 型 、 面 向 对 象 、 动 态 数据 类 型 的 高 级 程序 设计 语言 。 由 于 Python 语言 
简洁 、 易 读 并 且 可 扩展 ， 在 国外 用 Python 做 科学 计算 的 研究 机 构 日 益 增多 ， 最 近 几 年 其 社 
会 需求 逐渐 增加 , 许多 国内 高 校 纷纷 开设 Python 程序 设计 课程 。 本 书 编者 长 期 从 事 程序 设 
计 语 言 的 教学 与 应 用 开发 ， 了 解 在 学 习 编程 的 时 候 什么 样 的 书 能 够 提高 Python 开发 能 力 ， 
以 最 少 的 时 间 投 入 得 到 最 快 的 实际 应 用 。 

本 书 内 容 : 

第 1 章 是 Python 基础 知识 ， 主 要 讲解 Python 的 基础 语法 和 面向 对 象 编程 基础 、 图 形 
界面 设计 、Python 文件 的 使 用 、Python 的 第 三 方 库 等 知识 ， 读 者 可 以 轻松 掌握 。 

从 第 2 章 开 始 是 实用 项 目 案例 开发 ， 综 合 应 用 前 面 所 学 的 知识 ， 并 且 每 章 都 有 突出 的 
新 知识 点 ， 例 如 侧重 数据 库 应 用 的 案例 “智力 问答 测试 ” 应 用 疏 虫 技术 开发 的 案例 “校园 
网 搜索 引擎 ” 应 用 itchat 开发 的 案例 “ 微 信 机 器 人 ” 机 器 学 习 案例 “基于 朴素 贝 叶 斯 算 
法 的 文本 分 类 ” 深度 学 习 案例 “基于 卷 积 神经 网 络 的 手写 体 识 别 ” 等， 还 有 经 典 的 、 大 家 
耳熟能详 的 游戏 案例 ， 例 如 连连 看 、 推 箱子 、 中 国 象棋 、 两 人 麻将 、 人 物 拼 图 、 网 络 五 子 
棋 、 飞 机 大 战 等 。 

本 书 特点 : 

(1) Python 程序 设计 涉及 的 范围 非常 广泛 ， 本 书 内 容 的 编排 并 不 求全 、 求 深 ， 而 是 考 
虑 零 基 础 读者 的 接受 能 力 ， 语 言 的 语法 介绍 以 够 用 、 实 用 为 原则 ， 选 择 Python 中 必 备 、 实 
用 的 知识 进行 讲解 ， 强 化 对 程序 思维 能 力 的 培养 。 

(2) 案例 选取 贴近 生活 ， 有 助 于 提高 读者 的 学 习 兴 趣 。 

(3) 书 中 每 个 案例 均 提 供 了 详细 的 设计 思路 、 关 键 技术 分 析 以 及 具体 的 解决 方案 。 

需要 说 明 的 是 ， 学 习 编 程 是 一 个 实践 的 过 程 ， 而 不 仅仅 是 看 书 、 看 资料 ， 亲 自动 手 编 
写 、 调 试 程序 才 是 至 关 重 要 的 。 通 过 实际 的 编程 和 积极 的 思考 ， 读 者 可 以 很 快 地 掌握 许多 
宝贵 的 编程 经 验 ， 这 种 编程 经 验 对 开发 者 来 说 尤其 不 可 或 缺 。 

本 书 由 郑 秋生 和 夏 敏 捷 〈 中 原 工 学 院 ) 主持 编写 ， 吴 婷 (中原 工 学 院 ) 编写 第 6 章 ， 
韩 云 飞 (中 原 工学 院 ) 编写 第 8 章 ， 周 延 萍 编写 第 9、10 章 ， 宋 宝 卫 〈 郑 州 轻工业 学 院 ) 
编写 第 11 一 15 章 ， 陈 海 营 〈 中 原 工学 院 ) 编写 第 16、17 章 ， 高 艳 霞 (中 原 工学 院 ) 编写 
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第 18 章 , 李 娟 (中 原 工学 院 ) 编写 第 19 章 , 郑 秋 生 编 写 第 20 章 , 其 余 章 节 由 夏 敏捷 编写 。 
在 本 书 的 编写 过 程 中 ， 为 确保 内 容 的 正确 性 ， 参 阅 了 很 多 资料 ， 并 且 得 到 了 中 原 工学 院 的 
教材 资助 和 资深 Python 程序 员 的 支持 ,在 此 说 向 他 们 表示 衷心 的 感谢 。 本 书 的 学 习 资 源 可 
以 扫描 封底 课件 二 维 码 获取 。 由 于 编者 水 平 有 限 ， 书 中 难免 有 不 足 之 处 ， 敬 请 广大 读者 批 
评 指正 ， 在 此 表示 感谢 。 
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Python 是 一 门 跨 平台 、 开 源 、 免 费 的 解释 型 高 级 动态 编程 语言 ，Python 作为 动态 语言 
更 适合 初学 编程 者 。Python 可 以 让 初学 者 把 精力 集中 在 编程 对 象 和 思维 方法 上 ， 而 不 用 担 
心 语法 、 类 型 等 外 在 因素 。Python 易于 学 习 ， 拥 有 大 量 的 库 ， 可 以 高 效 地 开发 各 种 应 用 
程序 。 


1.1 Python 语言 简介 


Python 由 吉 多 范 罗 。 苏 姆 (Guido van Rossum) 于 1989 年 底 发 明 ， 被 广泛 应 用 于 处 理 
系统 管理 任务 和 科学 计算 ， 是 最 受 欢迎 的 程序 设计 语言 之 一 。2011 年 1 月 ， 它 被 TIOBE 
编程 语言 排行 榜 评 为 2010 年 度 语言 。 自 从 2004 年 以 后 ,Python 的 使 用 率 呈 线性 增长 , TIOBE 
最 近 公布 的 2018 年 9 月 编程 语言 指数 排行 榜 中 ，Python 超越 Ct+， 首 次 排名 处 于 第 三 位 
(前 两 位 是 Java 和 C)。2017 年 7 月， 根据 IEEE Spectrum 发 布 的 研究 报告 显示 ，Python 已 
经 成 为 世界 上 最 受 欢 迎 的 语言 。 

Python 支持 命令 式 编程 、 函 数 式 编程 ， 完 全 支持 面向 对 象 程序 设计 ， 语 法 简洁 清晰 ， 
并 且 拥 有 大 量 的 几乎 支持 所 有 领域 应 用 开发 的 成 熟 扩展 库 。 

Python 为 用 户 提 供 了 非常 完善 的 基础 代码 库 ， 和 覆盖 了 网 络 、 文 件 、GUI、 数 据 库 、 文 
本 等 大 量 内 容 ， 用 Python 开发 ， 许 多 功能 不 必 从 零 编写 ， 直接 使 用 现成 的 即 可 。 除 了 内 置 
的 库 外 ，Python 还 有 大 量 的 第 三 方 库 ， 也 就 是 别人 开发 的 ,大 家 可 以 直接 使 用 的 库 。 当 然 ， 
也 可 以 自己 开发 代码 通过 很 好 地 封装 ， 作 为 第 三 方 库 给 别人 使 用 。Python 就 像 胶水 一 样 ， 
可 以 把 用 多 种 不 同 语言 编写 的 程序 融合 到 一 起 实现 无 颖 拼接 ， 更 好 地 发 挥 不 同 语言 和 工具 
的 优势 , 满足 不 同 应 用 领域 的 需求 。 所 以 ,Python 程序 看 上 去 简单 易 懂 ， 初 学 者 学 Python， 
不 但 入 门 容易 ， 而 且 将 来 深入 下 去 ， 可 以 编写 那些 非常 复杂 的 程序 。 

Python 同时 支持 伪 编 译 ， 将 Python 源 程序 转换 为 字 节 码 来 优化 程序 和 提高 运行 速度 ， 
可 以 在 没有 安装 Python 解释 器 和 相关 依赖 包 的 平台 上 运行 。 
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Python 语言 的 应 用 领域 主要 如 下 。 

(1) Web 开发 : Python 语言 支持 网 站 开发 ， 比 较 流行 的 开发 框架 有 web2py、Django 
等 。 许 多 大 型 网 站 就 是 用 Python 开发 的 , 例如 YouTube、Instagram 等 。 很 多 大 公司 ,例如 
Google、Yahoo 等 ， 甚 至 NASA (美国 航空 航天 局 ) 都 大 量 地 使 用 Python。 

(2) 网 络 编程 : Python 语言 提供 了 socket 模块 ， 对 Socket 接口 进行 了 两 次 封装 ， 支 持 
Socket 接口 的 访问 ;还 提供 了 urllib、httplib、scrapy 等 大 量 模块 ， 用 于 对 网 页 内 容 进行 读 
取 和 处 理 ， 并 可 以 结合 多 线程 编程 以 及 其 他 有 关 模 块 快速 开发 网 页 息 虫 之 类 的 应 用 程序 ; 
可 以 使 用 Python 语言 编写 CGI 程序 ， 也 可 以 把 Python 程序 嵌入 到 网 页 中 运行 。 

(3) 科学 计算 与 数据 可 视 化 : Python 中 用 于 科学 计算 与 数据 可 视 化 的 模块 很 多 ， 例 如 
NumPy、SciPy、Matplotlib、Traits、TVTK、Mayavi、VPython、OpenCV 等 ， 涉 及 的 应 用 
领域 包括 数值 计算 、 符 号 计算 、 二 维 图 表 、 三 维 数据 可 视 化 、 三 维 动画 演示 、 图 像 处 理 以 
及 界面 设计 等 。 

(4) 数据 库 应 用 : Python 数据 库 模块 有 很 多 ， 例 如 可 以 通过 内 置 的 sqlite3 模 据 访问 
SQLite 数据 库 ; 使 用 pywin32 模块 访问 Access 数据 库 ; 使 用 pymysql 模块 可 
访问 MySQL 数据 库 ， 使 用 pywin32 和 pymssql 模块 访问 SQL Server 数据 库 。 

(5) 多 媒体 开发 : PYMedia 模块 可 以 对 WAV、MP3、AVI 等 多 媒体 格 
式 文件 进行 编码 、 解 码 和 播放 ，PyOpenGL 模块 封装 了 OpenGL 应 用 程序 ht 
编程 接口 ， 通 过 该 模块 可 以 在 Python 程序 中 集成 二 维 或 三 维 图 形 ，PIL 视频 讲解 
(Python Imaging Library, Python 图 形 库 ) 为 Python 提供 了 强大 的 图 像 处 理 
功能 ， 并 提供 广泛 的 图 像 文件 格式 支持 。 

(6) 电子 游戏 应 用 : Pygame 就 是 用 来 开发 电子 游戏 软件 的 Python 模块 ， 使 用 Pygame 
模块 可 以 在 Python 程序 中 创建 功能 丰富 的 游戏 和 多 媒体 程序 。 

Python 有 大 量 的 第 三 方 库 ， 可 以 说 需要 什么 应 用 就 能 找到 什么 Python 库 。 


1.2 ”Python 语法 基础 


1.2.1 ”Python 数据 类 型 


计算 机 程序 理所当然 地 可 以 处 理 各 种 数值 。 计 算 机 能 处 理 的 远 不 止 数 i 
值 ， 还 可 以 处 理 文本 、 图 形 、 音 频 、 视 频 、 网 页 等 各 种 各 样 的 数据 ， 不 同 。 回 ms 光 
的 数据 需要 定义 不 同 的 数据 类 型 。 视频 讲解 

@ 数值 类 型 

Python 数值 类 型 用 于 存储 数值 ，Python 支持 以 下 数值 类 型 。 

。 整 型 (int): 通常 被 称 为 整 型 或 整数 ， 是 正 或 负 整 数 ， 不 带 小 数 点 。 在 Python3 中 只 

有 一 种 整数 类 型 (int)， 没 有 Python2 中 的 long。 
。 浮 点 型 (float): 浮 点 型 由 整数 部 分 与 小 数 部 分 组 成 ， 浮 点 型 也 可 以 使 用 科学 记 数 法 
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表示 (2.78E2 就 是 2.78X 10:=278) 。 
。 复数 (complex): 复数 由 实数 部 分 和 虚数 部 分 构成 ， 可 以 用 atbj 或 者 complex(a,b) 
表示 ， 复 数 的 虚 部 以 字母 j 或 结尾， 例如 2+3j。 
数据 类 型 是 不 允许 改变 的 ， 这 就 意味 着 如 果 改 变数 值 数据 类 型 的 值 ， 将 重新 分 配 内 存 
空间 。 
四 字符 串 
字符 串 是 Python 中 最 常用 的 数据 类 型 。 用 户 可 以 使 用 引号 来 创建 字符 串 。Python 不 支 
持 字符 类 型 , 单字 符 在 Python 也 是 作为 一 个 字符 串 使 用 。Python 使 用 单 引 号 和 双 引 号 来 表 
示 字 符 串 是 一 样 的 。 
四 布尔 类 型 
Python 支持 布尔 类 型 的 数据 ， 布 尔 类 型 只 有 True 和 False 两 种 值 ， 但 是 布尔 类 型 有 以 
下 几 种 运算 。 
(1) and (与 ) 运算 :只 有 两 个 布尔 值 都 为 True 时 计算 结果 才 为 True。 


True and True # 结 果 是 True 

True and False # 结 果 是 False 

False and True # 结 果 是 False 

False and False # 结 果 是 False 

(2) or (或 ) 运算 : 只 要 有 一 个 布尔 值 为 True， 计 算 结果 就 是 True。 
True or True # 结 果 是 True 

True or False # 结 果 是 True 

False or True # 结 果 是 True 

False or False # 结 果 是 False 

(3) not (〈 非 ) 运算 : 把 True 变 为 False， 或 者 把 False 变 为 True。 
not True # 结 果 是 False 

not False # 结 果 是 True 


布尔 运算 在 计算 机 中 用 来 做 条 件 判 断 ， 根 据 计算 结果 为 True 或 者 False， 计 算 机 可 以 
自动 执行 不 同 的 后 续 代码 。 

在 Python 中 ， 布 尔 类 型 还 可 以 与 其 他 数据 类 型 做 and、or 和 not 运算 ， 这 时 下 面 的 几 
种 情况 会 被 认为 是 False: 为 0 的 数字 ， 包 括 0、0.0;， 空 字符 串 ''、""; 表示 空 值 的 None; 
空 集合 ， 包 括 空 元 组 9、 空 序列 ]、 空 字典 人 。 其 他 的 值 都 为 Tue。 例 如 : 


a='python' 

print (a and True) “ # 结 果 是 True 
Br 

print(b or False)  # 结 果 是 False 
@ 空 值 


空 值 是 Python 中 的 一 个 特殊 值 ， 用 None 表示 。 它 不 支持 任何 运算 ， 也 没有 任何 内 置 
函数 方法 。None 和 任何 其 他 数据 类 型 比较 永远 返回 False。 在 Python 中 未 指定 返回 值 的 函 
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数 会 自动 返回 None。 


1.2.2 ”序列 数据 结构 


数据 结构 是 计算 机 存储 、 组 织 数据 的 方式 。 序 列 是 Python 中 最 基本 的 数据 结构 。 序 列 
中 的 每 个 元 素 都 分 配 一 个 数字 ， 即 它 的 位 置 或 索引 , 第 1 个 索引 是 0， 第 2 个 索引 是 1， 依 
此 类 推 。 序列 都 可 以 进行 的 操作 包括 索引 、 截 取 (切片 )、 加 、 乘 、 成 员 检查 。 此 外 ，Python 
已 经 内 置 确定 序列 的 长 度 以 及 确定 最 大 和 最 小 元 素 的 方法 。Python 内 置 序列 类 型 最 常见 的 
是 列表 、 元 组 和 字符 串 。 另 外 ，Python 提供 了 字典 和 集合 这 样 的 数据 结构 ， 它 们 属于 无 顺 
序 的 数据 集合 体 ， 不 能 通过 位 置 索引 来 访问 数据 元 素 。 加 

上 列表 下 

列表 (List) 是 最 常用 的 Python 数据 类 型 ， 列 表 的 数据 项 不 需要 具有 ji 
相同 的 类 型 。 列 表 类 似 其 他 语言 的 数组 ， 但 功能 比 数组 强大 得 多 。 回 

创建 一 个 列表 , 只 要 把 逗号 分 隔 的 不 同 数据 项 使 用 方 括号 括 起 来 即 可 ， 视频 讲解 
实例 如 下 。 

list1=[" 中 国 '，' 美 国 "，1997，2000] 

Tst2= 23 4 

list3=["a", "b", "c", "d"]; 

列表 索引 从 0 开始。 列表 可 以 进行 截取 (切片 )、 组 合 等 。 

1) 访问 列表 中 的 值 

使 用 下 标 索 引 来 访问 列表 中 的 值 ， 同 样 可 以 使 用 方 括 号 的 形式 截取 字符 ， 实 例如 下 。 

list1=[' 中 国 '，' 美 国 '，1997,，2000]; 

E23 

prinEt*ListLLIOl: » LEstLLOl) 

print tLdstall Sl ist2plasT 

以 上 实例 的 输出 结果 : 

list1[0]: 中 国 

i en Na [| 

2) 更 新 列表 

可 以 对 列表 的 数据 项 进行 修改 或 更 新 ， 实 例如 下 。 

1ist=['" 中 国 '， "chemistry'，1997，2000]; 

print ("Value available at index 2 : ") 

print (list[2]) 

list[2]=2001; 


print ("New value available at index 2 : ") 
print (list[2]) 


以 上 实例 的 输出 结果 : 


Value available at index 2 : 
1997 
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New value available at index 2 : 
2001 


3) 删除 列表 元 素 
方法 一 : 使 用 del 语句 来 删除 列表 中 的 元 素 ， 实 例如 下 。 


1ist1=['" 中 国 '， "美国 '，1997，20001] 

print (list1) 

del list1l[21] 

print ("After deleting value at index 2 : ") 
print (list1) 

以 上 实例 的 输出 结果 : 


[' 中 国 '"，' 美 国 '，1997，2000] 
After deleting value at index 2 : 


[' 中 国 '，' 美 国 '，2000] 
方法 二 : 使 用 remove0 方 法 来 删除 列表 中 的 元 素 ， 实 例如 下 。 


list1=[' 中 国 '，' 美 国 '，1997，2000] 
listl.remove (1997) 
1ist1.remove (' 美 国 ') 

print (list1) 


以 上 实例 的 输出 结果 : 

[' 中 国 '，2000] 

方法 三 : 使 用 pop0 方 法 来 删除 列表 中 指定 位 置 的 元 素 ， 无 参数 时 删除 最 后 一 个 元 素 ， 
实例 如 下 。 

list1=[' 中 国 '，' 美 国 '，1997，2000] 


list1.pop (2) # 删 除 位 置 2 的 元 素 1997 
1ist1.pop() # 删 除 最 后 一 个 元 素 2000 
print (list1) 

以 上 实例 的 输出 结果 : 


[' 中 国 '，' 美 国 '] 
4) 添加 列表 元 素 
可 以 使 用 append0 方 法 在 列表 的 末尾 添加 元 素 ， 实 例如 下 。 


1ist1=[' 中 国 '，' 美 国 '，1997，2000] 
listl1.append (2003) 
print (list1) 


以 上 实例 的 输出 结果 : 
[' 中 国 '，' 美 国 '，1997,，2000，2003] 


5) 定义 多 维 列表 
可 以 将 多 维 列表 视 为 列表 的 嵌 套 ， 即 多 维 列表 的 元 素 值 也 是 一 个 列表 ， 只 是 维度 比 父 
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| 号 本 项 目 案例 开发 
从 入 门 到 实战 一 一 仆 虫 、 游 戏 和 机 器 学 习 


列表 小 一 。 二 维 列表 〈 即 其 他 语言 的 二 维 数组 ) 的 元 素 值 是 一 维 列表 ， 三 维 列表 的 元 素 值 
是 二 维 列表 。 例 如 定义 一 个 二 维 列表 。 

list2=[["CPU"， "内存"]，[" 人 硬盘" "声卡 "]] 

二 维 列表 比 一 维 列表 多 一 个 索引 ， 可 以 如 下 获取 元 素 : 

列表 名 [索引 1] [索引 2] 

例如 定义 3 行 6 列 的 二 维 列表 ， 打 印 出 元 素 值 。 


TOwS=3 


Cols=6 
matrix=[[0 for col in range(cols)] for row in range (Fows)] 
列表 生成 式 生成 二 维 列表 
for i in range (rows): 
for j in range (cols) : 
matrix[i] [j]=i*3+j 
print (matrix[i] [j],end=",") 
pELnE(tE Na 
以 上 实例 的 输出 结果 : 
Ol 3 A 
3 GT 
OOo 
列表 生成 式 (List Comprehensions) 是 Python 内 置 的 一 种 极其 强大 的 生成 列表 的 表达 
式 。 如 果 要 生成 一 个 list [1 ,2 ,3 ,4,5,6,7,8,9]， 可 以 用 range(1,10): 


>>> L=list (range (1,10)) >. A | 
如 果 要 生成 [1 X1,2X2,3X3 ,… , 10X10]， 可 以 使 用 循环 : 
>>> L=[] 


>>> for x in range(1,10): 
L.append (x*x) 

> 

Ta oe 2 a6 A Moa el 

列表 生成 式 ， 可 以 用 以 下 语句 代替 以 上 烦琐 的 循环 来 完成 : 

>>> [x*x for x in range(1,11)] 

Te ee ri | 

列表 生成 式 的 书写 格式 为 把 要 生成 的 元 素 x*x 放 到 前 面 ， 后 面 跟 上 for 循环 。 这 样 就 
可 以 把 列表 创建 出 来 。for 循环 后 面 还 可 以 加 上 站 判 断 ， 例 如 第 选 出 偶数 的 平方 : 

>>> [x*x for x in range(1,11) if x%2==0] 


[4, 16, 36, 64, 100] 


再 如 ， 把 一 个 列表 中 的 所 有 字符 串 变 成 小 写 形式 : 
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>>> I=[7Hel1o"， "7 World'，"IBM"， "RARpple"] 

>5> [9S TowSr() for sin Tl 

['hello', 'world', 'ibm', 'apple'] 

当然 ， 列 表 生 成 式 也 可 以 使 用 两 层 循环 ， 例 如 生成 ABC' 和 'XYZ' 中 字母 的 全 部 组 合 : 
>>> print([mtn for m in "ABC' for n in "7XY27]) 


[le en cer 


for 循环 其 实 可 以 同时 使 用 两 个 甚至 多 个 变量 ,例如 字典 (Dict) 的 items() 可 以 同时 过 


代 key 和 value: 


改 。 元 组 使 用 小 括号 0， 列 表 使 用 方 括号 []。 元 组 中 的 元 素 类 型 也 可 以 不 
相同 。 


>>> d={'X': IIy': 'B'，'z': !'C'} 4# 字 典 
>>2 for Er Vv LEemsty 
print (K，' 键 ='，vVv,， endl=';') 


程序 的 运行 结果 : 

y 键 =B; x 键 =A; z 键 =C; 

因此 ， 列 表 生 成 式 也 可 以 使 用 两 个 变量 来 生成 列表 : 

>>> d={'x': ROY 'B', 'z': 'C'} 

>>> [k+'='+V for k，V in d.items()] 

['y=B', 'x=A', '2z=C'] 

@ 元 组 

Python 的 元 组 〈tuple) 与 列表 类 似 ， 不 同 之 处 在 于 元 组 的 元 素 不 能 修 


1) 创建 元 组 视频 讲解 
元 组 的 创建 很 简单 ， 只 需要 在 括号 中 添加 元 素 ， 并 使 用 逗号 隔 开 即 可 ， 实 例如 下 。 
tupl=(' 中 国 '，' 美 国 '"，1997，2000) 


(a 2 ee 5) 
tup3="an, "br, cn, nd" 


如 果 是 创建 空 元 组 ， 只 需 写 个 空 括号 即 可 。 


tup1=() 
当 元 组 中 只 包含 一 个 元 素 时 ， 需 要 在 第 1 个 元 素 后 面 添加 逗号 。 
tupl=(50,) 


元 组 与 字符 串 类 似 ， 下 标 索引 从 0 开始 ， 可 以 进行 截取 、 组 合 等 。 
2) 访问 元 组 

元 组 可 以 使 用 下 标 索 引 来 访问 元 组 中 的 值 ， 实 例如 下 。 
tupl=(' 中 国 '"，' 美 国 '"，1997，2000) 

Eup2e (a 2 a en 


| 上 本 项 目 案例 开 


从 入 门 到 实战 一 一 看 虫 、 游 戏 和 机 器 学 习 


EnE(EupTIOT ”Eaplioly # 输 出 元 组 的 第 1 个 元 素 

print ("tup2[1:5]: ™, tup2[1:5]) # 切 片 ， 输 出 从 第 2 个 元 素 开 始 到 第 5 个 元 素 
print (tup2[2:]) # 切 片 ， 输 出 从 第 3 个 元 素 开始 的 所 有 元 素 
print (tup2 * 2) # 输 出 元 组 两 次 

以 上 实例 的 输出 结果 : 

tupl[0]: 中 国 


二 aaD2 25] (27 3 A 3) 

(3, 4, 5, 6, 7) 

le ee 

3) 连接 元 组 

元 组 中 的 元 素 值 是 不 允许 修改 的 ， 但 可 以 对 元 组 进行 连接 组 合 ， 实 例如 下 。 
tupl=(12, 34, 56) 

tup2=(78, 90) 


#tupl [0]=100 # 修 改元 组 中 元 素 的 操作 是 非法 的 
tup3=tupl+tup2 # 连 接 元 组 ， 创 建 一 个 新 的 元 组 
print (tup3) 

以 上 实例 的 输出 结果 : 


(12, 34, 56, 78, 90) 


4) 删除 元 组 

元 组 中 的 元 素 值 是 不 允许 删除 的 ， 但 可 以 使 用 del 语句 来 删除 整个 元 组 ， 实 例如 下 。 
tup=(' 中 国 '，' 美 国 '，1997，2000); 

print (tup) 

del tup 

print ("After deleting tup : ") 

print (tup) 

以 上 实例 元 组 被 删除 后 ， 输 出 变量 会 有 异常 信息 ， 输 出 如 下 。 


("中 国 "， "美国 "，1997，2000) 
After deleting tup : 
NameError: name 'tup' is not defined 


5) 元 组 与 列表 的 转换 
因为 元 组 数 不 能 改变 ， 所 以 将 元 组 转换 为 列表 从 而 可 以 改变 数据 。 实 际 上 ， 列 表 、 元 
组 和 字符 串 之 间 可 以 互相 转换 ， 需 要 使 用 3 个 函数 ， 即 sttO0、tuple0 和 list()。 

可 以 使 用 下 面 的 方法 将 元 组 转换 为 列表 : 

列表 对 象 =1ist (元 组 对 象 ) 


例如 : 

Eupe ll Dr dd 5 

list1=1ist (tup) # 元 组 转换 为 列表 

print (1ist1) 世 到 加 [2 三 4 
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可 以 使 用 下 面 的 方法 将 列表 转换 为 元 组 : 
元 组 对 象 =tuple (列表 对 象 ) 
例如 : 


nums— ll 3 5 7 8 320] 
print (tuple (nums) ) # 列 表 转 换 为 元 组 ， 返 回 (1，3，5, 7,8,，13，20) 


将 列表 转换 成 字符 串 如 下 : 


SEE 0 

strl=str (nums) # 列 表 转 换 为 字符 串 ， 返 回 含 中 括号 及 逗号 的 ' [1，3，5，7，8， 
#13，20] ' 字 符 串 

print (str1[2]) # 打 印 出 逗号 ， 因 为 字符 串 中 索引 号 为 2 的 元 素 是 逗号 

num2=[' 中 国 '，' 美 国 '，' 日 本 '，' 加 拿 大 '] 


与 记 守 之 生 中 靳 人 

str2=str2.join (num2) # 用 百 分 号 连接 起 来 的 字符 串 一 一 ' 中国 $ 美 国 $ 日 本 $s 加拿大 ' 
str2="" 

str2=str2.join(num2) ， # 用 空 字 符 连接 起 来 的 字符 串 一 一 ' 中 国美 国 日 本 加 拿 大 ' 

(3 字典 


Python 字典 (dict) 是 一 种 可 变 容器 模型 ， 且 可 存储 任意 类 型 对 象 ， 例 
如 字符 串 、 数 字 、 元 组 等 其 他 容器 模型 。 字 典 也 被 称 为 关联 数组 或 哈 希 表 。 

1) 创建 字典 

字典 由 键 和 对 应 值 (key=>value) 成 对 组 成 。 在 字典 的 每 个 键 / 值 对 中 ， 
键 和 值 用 冒号 分 隔 ， 键 / 值 对 之 间 用 逗号 分 隔 ， 整 个 字典 包括 在 花 括号 中 。 
其 基本 语法 如 下 : 


d={keyl: valuel, key2: value2} 


注意 : 键 必须 是 唯一 的 ， 值 则 不 必 。 值 可 以 取 任 何 数据 类 型 ， 但 键 必 须 是 不 可 变 的 ， 
例如 字符 串 、 数 字 或 元 组 。 


视频 讲解 


一 个 简单 的 字典 实例 : 
站 
当然 也 可 以 如 此 创建 字典 : 


dictl={'abc': 456}; 

dict2=1abc's, 23 9826: 3737 

字典 有 如 下 特性 : 

(1) 字典 值 可 以 是 任何 Python 对 象 ， 例 如 字符 串 、 数 字 、 元 组 等 。 

(2) 不 允许 同一 个 键 出 现 两 次 ， 在 创建 时 如 果 同 一 个 键 被 赋值 两 次 ， 后 一 个 值 会 覆盖 
前 面 的 值 。 

dict={'Name': 'xmj', 'Age': 17, 'Name': 'Manni'}; 

print ("dict['Name']: ", dict['Name']); 


| 六 要 项 目 案例 开发 


从 入 门 到 实战 一 一 仆 虫 、 游 戏 和 机 器 学 习 
以 上 实例 的 输出 结果 : 
dict['Name']: Manni 
(3) 键 不 可 变 ， 所 以 可 以 用 数字 、 字 符 串 或 元 组 充当 ， 用 列表 不 行 ， 实 例如 下 。 
dict={['Name']: 'Zara', 'Age': 7}; 
以 上 实例 输出 错误 结果 : 
Traceback (most recent call last): 
File "<pyshell#0>", line 1, in <module> 
dict={['Name']: 'Zara', 'Age': 7} 
TypeError: unhashable type: 'list' 
2) 访问 字典 里 的 值 
在 访问 字典 里 的 值 时 把 相应 的 键 放 到 方 括 号 中 ， 实 例如 下 。 
dict={"Name': "下海"，"Age": 17， "Class": "计算 机 一 班 中 
print ("dict['Name']: ", dict['Name']) 
print ("dict['Age']: ", dict['Age']) 
以 上 实例 的 输出 结果 : 
dict['Name']: 王 海 
dict[l Ager le LL 
如 果 用 字典 里 没有 的 键 访问 数据 ， 会 输出 错误 信息 : 
dict=t" Nane': “下海 "，"Age": "177 “Class": 计算 机 三 班 呈 
print(sarctl sox le ndGicEISS 
由 于 没有 sex 键 ， 以 上 实例 输出 错误 结果 
Traceback (most recent call last): 


File "<pyshell#10>", line 1, in <module> 
printi*dlet Db sex le "dlcElsexd ly 


KeyError: ‘sex' 


3) 修改 字典 

向 字典 里 添加 新 内 容 的 方法 是 增加 新 的 键 / 值 对 ， 修 改 或 删除 已 有 键 / 值 对 ， 实 例如 下 。 
dict={'Name' : ' 王 海 '， "age': 17， "Class': "计算 机 一 班 '} 

dict['Age']=18 # 更 新 键 / 值 对 

dict['school']=" 中 原 工学 院 " ## 增 加 新 的 键 / 值 对 

print ("dict['Age']: ", dict['Age']) 

prinEt*alct[l Schoon ls "dct[lsSchoou ls 


以 上 实例 的 输出 结果 : 


dict['Age']: 18 
dict['school']: 中原 工学 院 
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4) 删除 字典 中 的 元 素 
del0 方 法 允许 使 用 键 从 字典 中 删除 元 素 〈 条 目 )。clear() 方 法 清空 字典 中 的 所 有 元 素 。 
显 式 删 除 一 个 字典 用 del 命令 ， 实 例如 下 。 


dict=f'Name': ' 王 海 '，"'Age': 17，'Class": "计算 机 一 班 " 


del dict['Name'] # 删 除 键 是 'Name' 的 元 素 (条 目 ) 
dict.clear() # 清 空 字典 中 的 所 有 元 素 

del dict # 删 除 字 典 ， 用 del 删除 后 字典 不 再 存在 
5) in 运算 


字典 里 的 in 运算 用 于 判断 某 键 是 否 在 字典 里 ， 对 于 value 值 不 适用 ， 其 功能 与 
has_key (key) 相 似 。 
dict=t Name"s " 王 海 '"，"Age": 17，"Class": "计算 机 一 班 "Y 


print ('Age' in dict) # 等 价 于 print (dict.has_key('Age')) 
以 上 实例 的 输出 结果 : 

True 

6) 获取 字典 中 的 所 有 值 

dict.values() 以 列表 形式 返回 字典 中 的 所 有 值 。 


dict={ "Name': ' 王 海 '，'"Age": 17，'Class": "计算 机 一 班 ")} 

print (dict.values ()) 

以 上 实例 的 输出 结果 : 

[17,，' 王 海 '"， “计算 机 一 班 "] 

7) items() 方 法 

items() 方 法 把 字典 中 的 每 对 key 和 value 组 成 一 个 元 组 , 并 把 这 些 元 组 放 在 列表 中 返回 。 

dict=1"Nane': "下海" "nges: 17 "CUassu yi 计算 机 三 班 二 

for key,value in dict.items(): 

print (key, value) 

以 上 实例 的 输出 结果 : 

Name 王 海 

class 计算 机 一 班 

Age 17 

注意 : 字典 打印 出 来 的 顺序 与 创建 之 初 的 顺序 不 同 ， 这 不 是 错误 。 字典 中 的 各 个 元 素 
并 没有 顺序 之 分 ( 因为 不 需要 通过 位 置 查找 元 素 )， 所 以 在 存储 元 素 时 进行 了 优化 ,使 字典 
的 存储 和 查询 效率 最 高 。 这 也 是 字典 和 列表 的 另 一 个 区 别 : 列表 保持 元 素 的 相对 关系 ， 即 
序列 关系 ; 而 字典 是 完全 无 序 的 ， 也 称 为 非 序 列 。 如 果 想 保持 一 个 集合 中 元 素 的 顺序 ， 需 
要 使 用 列表 ， 而 不 是 字典 。 


@ 集合 
集合 (set) 是 一 个 无 序 不 重复 元 素 的 序列 。 集 合 的 基本 功能 是 进行 成 员 关 系 测试 和 删 
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pe 项 目 案例 开发 
从 入 门 到 实战 一 一 让 虫 、 游 戏 和 机 器 学 习 
除 重复 元 素 。 
1) 创建 集合 
可 以 使 用 大 括号 ({}) 或 者 set0 函 数 创建 集合 。 注 意 ， 创 建 一 个 空 集合 必须 用 set()， 
而 不 是 用 人 }， 因 为 位 用 来 创建 一 个 空 字典 。 
student={'Tom’', ‘'Jim', 'Mary', 'Tom', 'Jack', 'Rose'} 
print (student) “# 输 出 集合 ， 重 复 的 元 素 被 自动 去 掉 
以 上 实例 的 输出 结果 : 
tudek ee “Ros MMary ee Mrmy ee NTOowmLy, 
2) 成 员 测 试 
例如 : 


if('Rose' in student) : 
print ('Rose 在 集合 中 ') 


Sse 
print ('Rose 不 在 集合 中 ') 
以 上 实例 的 输出 结果 : 
Rose 在 集合 中 
3) 集合 运算 
可 以 使 用 “-”“|”“&” 运 算 符 进 行 集合 的 差 集 、 并 集 、 交 集运 算 ， 例 如 : 
#set 可 以 进行 集合 运算 


a=set ('abcd') 
b=set ('cdef') 


print (a) 

print ("a 和 Pb 的 差 集 : "，a - b) #a 和 的 差 集 
print ("a 和 pb 的 并 集 : "，a | b) #a 和 b 的 并 集 
print ("a 和 b 的 交集 : "，a & b) #a 和 bb 的 交集 


print ("a 和 bb 中 不 同时 存在 的 元 素 : "，a ^ b) #a 和 b 中 不 同时 存在 的 元 素 
以 上 实例 的 输出 结果 : 

a 

a 和 bb 的 差 集 : {'a'，'b'} 

a 和 bb 的 并 集 :; {'b'， va', 'f', 'd', iC, 'e'} 

a 和 上 b 的 交集 : {'c'，'d'} 

a 和 bb 中 不 同时 存在 的 元 素 : {'a'，'e',，'f','b'} 


1.2.3 “Python 控制 语句 


对 于 Python 程序 中 的 执行 语句 , 默认 是 按照 书写 顺序 依次 执行 的 , 通常 说 这 样 的 语句 
是 顺序 结构 的 。 但 是 ， 仅 有 顺序 结构 还 不 够 ， 因 为 有 时 候 需要 根据 特定 的 情况 有 选择 地 执 
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行 某 些 语句 ， 这 时 就 需要 一 种 选择 结构 的 语句 。 另 外 ， 有 时 候 还 可 以 在 给 ” 国 六 x 后 
定 条 件 下 重复 执行 某 些 语句 ， 通 常 称 这 些 语句 是 循环 结构 的 。 有 了 这 3 种 
基本 结构 ， 就 能 构建 任意 复杂 的 程序 了 。 

3 种 基本 程序 结构 中 的 选择 结构 ， 可 以 用 寺 语 句 、f…else 语句 和 还 … 视频 讲解 
elif.…else 语句 实现 。 

让 语句 是 一 种 单 选 结构 ， 它 选择 的 是 做 与 不 做 。 站 语句 的 语法 形式 如 下 : 

if 表达 式 : 

语句 1 


让 语句 的 流程 图 如 图 1-1 所 示 。 


图 1-1 让 语句 的 流程 图 
if…else 语句 是 一 种 双 选 结构 , 用 于 解决 在 两 种 备 选 行动 中 选择 哪 一 个 的 问题 。if…else 
语句 的 语法 形式 如 下 : 
if 表达 式 : 
语句 1 


elsey 
语句 2 


if…else 语句 的 流程 图 如 图 1-2 所 示 。 


图 1-2 ”让 …else 语句 的 流程 图 


[ 贺 1-1 输入 一 个 年 份 ， 判 断 是 否 为 头 年 。 
六 年 的 年 份 必 须 满足 以 下 两 个 条 件 之 一 : 
(1) 能 被 4 整除 ， 但 不 能 被 100 整除 。 

(2) 能 被 400 整除 。 


pe 项 目 案例 开 


从 入 门 到 实战 一 一 惟 虫 、 游 戏 和 机 器 学 习 


分 析 : 设 变量 year 表示 年 份 ， 判 断 year 是 否 满足 以 下 表达 式 。 
条 件 (1) 的 逻辑 表达 式 是 year%4-0&&year%100 !=0。 

条 件 (2) 的 逻辑 表达 式 是 year%400 一 0。 

两 者 取 “ 或 ”” 即 得 到 判断 闻 年 的 逻辑 表达 式 : 


(years4==0 and year®100!=0) or Years400==0 
程序 代码 : 


year=int (input (' 输 入 年 份 :')) # 输 入 x，input () 获取 的 是 字符 串 ， 所 以 需要 转换 成 整 弄 
if years4==0 and yearsl001!=0 or years400==0: 间 注 意 运算 符 的 优先 级 

print (year，" 是 半年 ") 
elses 

print (Year， "不 是 头 年 ") 


在 判断 间 年 后 ， 也 可 以 输入 某 年 某 月 某 日 ， 判 断 这 一 天 是 这 一 年 的 第 几 天 。 以 3 月 5 
日 为 例 ， 应 该 先 把 前 两 个 月 的 天 数 加 起 来 ， 然 后 再 加 上 5 天 ， 即 本 年 的 第 几 天 。 特 殊 情况 
是 闵 年 ， 在 输入 月 份 大 于 3 时 需 考虑 多 加 一 天 。 


程序 代码 : 

year=int (input ('year:')) # 输 入 年 
month=int (input ('month:')) # 输 入 月 
day=int (input ('day:')) # 输 入 日 


months=(0, 31,59, 90,120,151,181, 212, 243, 273, 304, 334) 
if 0<=month<=12: 
sum=months [month - 1] 
elses 
print (' 月 份 输入 错误 ') 
sumt+=day 
leap=0 
if (year%400==0) or ((Yyears4==0) and (year®100!=0)): 
leap=1 
if (leap==1) and (month>2): 
sum+=1 
print (' 这 一 天 是 这 一 年 的 第 $d 天 '%sum) 
有 时 候 需 要 在 多 组 动作 中 选择 一 组 执行 , 这 时 就 要 用 到 多 选 结构 ， 对 于 Python 语言 来 
说 就 是 直 …elif…else 语句 。 该 语句 的 语法 形式 如 下 : 
if 表达 式 1: 
语句 1 
elif 表达 式 2: 
语句 2 
elif 表达 式 n: 
语句 n 
全 下 SS 
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语句 n+1 
注意 : 最 后 一 个 elif 子 句 之 后 的 else 子 句 没有 进行 条 件 判 断 ， 它 实际 上 处 理 跟 前 面 所 
有 条 件 都 不 匹配 的 情况 ,所 以 else 子 句 必须 放 在 最 后 。 if…elif-…else 语句 的 流程 图 如 图 1-3 
所 示 。 


图 1-3 ”if…elif…else 语句 的 流程 图 


[ 圆 1-2 输入 学 生 的 成 绩 score， 按 分 数 输出 其 等 级 ， 即 score 宇 90 为 优 ，90>score 过 
80 为 良 ，80>score 宇 70 为 中 等 ，70>score 宇 60 为 及 格 ，score<60 为 不 及 格 。 


score=int (input ("请 输入 成 绩 ") ) #int () 转换 字符 串 为 整 型 
if score>=90 : 
print (" 优 ") 
elif score>=80: 
Print (" 良 ") 
elif score>=70: 
prunele hn 
elif score>=60: 
print ("及 格 ") 
SEE 
print ("不 及 格 ") 

说 明 : 在 3 种 选择 语句 中 ， 条 件 表达 式 都 是 必 不 可 少 的 组 成 部 分 。 当 条 件 表达 式 的 值 
为 零 时 ， 表 示 条 件 为 假 ， 当 条 件 表达 式 的 值 为 非 零 时 ， 表 示 条 件 为 真 。 那 么 哪些 表达 式 可 
以 作为 条 件 表 达 式 呢 ? 最 常用 的 是 关系 表达 式 和 逻辑 表达 式 ， 例 如 

if a==x and b==y : 

print ("a=x, b=y") 


除 此 之 外 ， 条 件 表达 式 可 以 是 任何 数值 类 型 的 表达 式 ， 字 符 串 也 可 以 


| 号 项 目 案例 开发 
从 入 门 到 实战 一 一 仆 虫 、 游 戏 和 机 器 学 习 
be 可 
print ("a=x, b=y") 
另外 ，C 语言 用 花 括号 外来 区 分 语句 体 ， 但 Python 的 语句 体 是 用 缩 进 形式 来 表示 的 ， 
如 果 缩 进 不 正确 ， 会 导致 逻辑 错误 。 
@ 循环 结构 
程序 在 一 般 情况 下 是 按 顺 序 执行 的 。 编 程 语言 提供 了 各 种 控制 结构 ， 
允许 更 复杂 的 执行 路 径 。 循 环 语句 允许 用 户 执 行 一 个 语句 或 语句 组 多 次 ， 
Python 提供 了 for 循环 和 while 循环 (在 Python 中 没有 do…while 循环 )。 
1) while 语句 
在 Python 编程 中 ，while 语句 用 于 循环 执行 程序 ， 即 在 某 条 件 下 循环 - 
执行 某 段 程序 ， 以 处 理 需 要 重复 处 理 的 相同 任务 。 其 基本 形式 如 下 : 视频 讲解 
while 判断 条 件 : 
执行 语句 
执行 语句 可 以 是 单个 语句 或 语句 块 。 判 断 条 件 可 以 是 任何 表达 式 ， 任 何 非 零 或 非 空 的 
值 均 为 True。 当 判断 条 件 为 False 时 ， 循 环 结束 。while 语句 的 流程 图 如 图 1-4 所 示 。 


图 1-4 while 语句 的 流程 图 
同样 需要 注意 冒号 和 缩 进 ， 例 如 : 


count=0 
while count<5: 
print('The count is:', count) 
count=count+1 
print ("Good bye!") 
2) for 语句 
for 语句 可 以 遍历 任何 序列 的 项 目 , 例如 一 个 列表 、 元 组 或 者 一 个 字符 
串 。for 循环 的 语法 格式 如 下 : 田 
for 循环 索引 值 in 序列 视频 讲解 
循环 体 


for 循环 会 把 列表 中 的 元 素 遍历 出 来 ,例如 以 下 代码 会 依次 打印 fruits 中 的 每 一 个 元 素 。 


fruits=['banana', "apple'，'mango'] 
EOFTEraaE dn Froalts # 第 2 个 实例 
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print (' 元 素 :'， fruit) 
print ("Good bye!") 


程序 的 运行 结果 : 


元 素 : banana 
元 素 : apple 
元 素 : mango 
Good bye! 


[ 辆 ]13 计算 1 一 10 的 整数 之 和 ， 可 以 用 一 个 sum 变量 做 累加 。 
程序 代码 : 

sum=0 

one mn I A OT le 


SUm=SUm+X 


print (sum) 


如 果 要 计算 1 一 100 的 整数 之 和 ， 从 1 写 到 100 有 点 困难 。Python 提供 了 range(O 内 置 


函数 ， 可 以 生成 一 个 整数 序列 ， 再 通过 list0 函 数 转换 成 列表 。 


例如 ，range(0, 5) 或 range(5) 生 成 的 序列 是 从 0 开始 小 于 5 的 整数 ， 不 包括 5。 
>>> list (range (5)) 

[ou 2 

range(1, 101) 就 可 以 生成 1 一 100 的 整数 序列 ， 计 算 1 一 100 的 整数 之 和 如 下 。 


sum=0 

for x in range(1,101) : 
sum=sum+x 

print (sum) 


3) continue 和 break 语句 


break 语句 在 while 循环 和 for 循环 中 都 可 以 使 用 , 一 般 放 在 直选 择 结构 中 , 一 旦 break 


语句 被 执行 ， 将 使 整个 循环 提前 结束 。 


continue 语句 的 作用 是 终止 当前 循环 ， 并 忽略 continue 之 后 的 语句 ， 然 后 回 到 循环 的 


顶端 ， 提 前 进入 下 一 次 循环 。 


除非 break 语句 能 让 代码 更 简单 或 更 清晰 ， 否 则 不 要 轻易 使 用 。 
[加 14 continue 和 break 用 法 示例 。 


#continue 和 break 用 法 
i=1 
while i<10: 
i+=] 
E20 # 非 双 数 时 跳 过 输出 
continue 
print (i) # 输 出 双 数 2、4、6、8、10 


i=1 


while 1: # 循 环 条 件 为 1 必定 成 立 


| 滞 有 项 目 案例 开发 
从 入 门 到 实战 一 一 仆 虫 、 游 戏 和 机 器 学 习 


print (i) # 输 出 1 一 10 

i+=1 

TO: # 当 工大 于 10 时 跳出 循环 
break 


在 Python 程序 开发 的 过 程 中 , 将 完成 某 一 特定 功能 并 经 常 使 用 的 代码 编写 成 函数 ， 放 
在 函数 库 〈 模 块 ) 中 供 大 家 选用 ， 在 需要 使 用 时 直接 调用 ， 这 就 是 程序 中 的 函数 。 开 发 人 
员 要 善于 使 用 函数 ， 以 提高 编码 效率 ， 减 少 编写 程序 段 的 工作 量 。 


1.2.4 ” Python 国 数 与 模块 


当 某 些 任务 〈 例 如 求 一 个 数 的 阶乘 ) 需要 在 一 个 程序 中 的 不 同位 置 重复 执行 时 ， 会 造 
成 代码 的 重复 率 高 ， 应 用 程序 代码 烦琐 。 解 决 这 个 问题 的 方法 就 是 使 用 函数 。 无 论 是 在 哪 
门 编程 语言 中 ， 函 数 〈 在 类 中 称 为 方法 ， 意 义 是 相同 的 ) 都 扮演 着 至 关 重 要 的 角色 。 模 块 
是 Python 的 代码 组 织 单元 ， 它 将 函数 、 类 和 数据 封装 起 来 以 便 重 用 ， 模 块 往往 对 应 Python 
程序 文件 ，Python 标准 库 和 第 三 方 提 供 了 大 量 的 模块 。 

@ 男 数 的 定义 

在 Python 中 ， 函 数 定义 的 基本 形式 如 下 : 

def 函数 名 (函数 参数 ) : 


函数 体 
return 表达 式 或 者 值 


在 这 里 说 明 几 点 : 

(1) 在 Python 中 采用 def 关键 字 进 行 函 数 的 定义 ， 不 用 指定 返回 值 的 类 型 。 

(2) 函数 参数 可 以 是 零 个 、 一 个 或 者 多 个 ， 同 样 ， 函 数 参数 也 不 用 指定 参数 类 型 ， 因 
为 在 Python 中 变量 都 是 弱 类 型 的 ，Python 会 自动 根据 值 来 维护 其 类 型 。 

(3) 在 Python 中 ， 函 数 定 义 中 的 缩 进 部 分 是 函数 体 。 

(4) 函数 的 返回 值 是 通过 函数 中 的 retum 语句 获得 的 。retum 语句 是 可 选 的 ， 它 可 以 
在 函数 体内 的 任何 地 方 出 现 ， 表 示 函 数 调用 执行 到 此 结束 ; 如 果 没 有 retum 语句 ， 会 自动 
返回 None( 空 值 )， 如 果 有 retum 语句 ， 但 是 retum 后 面 没有 接 表 达 式 或 者 值 ， 也 是 返回 
None ( 空 值 )。 

下 面 定 义 3 个 函数 : 

def printHello() : # 打 印 'hello' 字 符 串 

print('hello') 


def printNum() : # 输 出 数字 0 一 9 
for i in range(0,10): 
print (i) 
return 
def add(a,b): # 实 现 两 个 数 的 和 
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return a+b 


人 @ 琴 数 的 使 用 

在 定义 了 函数 之 后 就 可 以 使 用 该 函数 了 ， 但 是 在 Python 中 要 注意 一 个 问题 ， 就 是 在 
Python 中 不 允许 前 向 引用 ， 即 在 函数 定义 之 前 不 允许 调 上 E 
下 面 的 例子 就 明白 了 : 

print (add (1,2)) 

def add(a,b): 

return a+b 
这 段 程 序 运行 的 错误 提示 如 下 : 


Traceback (most recent call last): 


File "C:/Users/zxmj/4-1.py", line 1, in <module> 
print (add (1,2)) 
NameError: name "add' is not defined 


从 报 的 错 可 以 知道 ， 名 字 为 add 的 函数 未 进行 定义 。 所 以 在 任何 时 候 调 用 某 个 函数 ， 
必须 确保 其 定义 在 调用 之 前 。 
加 15 编写 函数 ， 计 算 形 如 a+aa+aaa+aaaa +…+ aaa…aaa 的 表达 式 的 值 ， 其 中 a 为 
小 于 10 的 自然 数 。 例 如 2+22+222+2222+22222〈 此 时 n=5)，a、n 由 用 户 从 键盘 输入 。 
分 析 : 关键 是 计算 出 求 和 中 每 一 项 的 值 。 容易 看 出 每 一 项 都 是 前 一 项 扩大 10 倍 后 加 a。 
程序 代码 : 
def suml(a, n): 
result, t=0, 0 # 同 时 将 result、t 赋值 为 0， 这 种 形式 比较 简洁 
for i in range (n) : 
t=t*10+a 
Tresultt=t 


return result 


# 用 户 输 入 两 个 数字 

a=int (input ("输入 a: ")) 

n=int (input ("输入 n: ")) 

print (sum(a, n)) 

程序 运行 结果 : 

输入 a: 2 

输入 n: 5 

24690 

图 闭 包 

在 Python 中 ， 闭 包 〈closure) 指 函数 的 嵌 套 。 用 户 可 以 在 函数 内 部 定 
义 一 个 典 套 函数 ， 将 嵌 套 函数 视 为 一 个 对 象 ， 所 以 可 以 将 嵌 套 函数 作为 定 
义 它 的 函数 的 返回 结果 。 

[ 贺 1-6 使 用 闭 包 的 例子 。 视频 讲解 
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| 中 苹 项 目 案例 开发 


调 上 


分 配 到 一 个 模块 里 能 让 代码 更 好 用 、 更 易 懂 。 简 单 地 说 ， 模 块 就 是 一 个 保 
存 了 Python 代码 的 文件 。 在 模块 里 能 定义 函数 、 类 和 变量 。 


从 入 门 到 实战 一 一 疏 虫 、 游 戏 和 机 器 学 习 
def func lib(): 
def add (x, y): 


return x+y 


return add # 返 回 函 数 对 象 


fadd=func lib() 
Print(fadd(1，2)) 


在 函数 fanc lib0 中 定义 了 一 个 嵌 套 函数 add(x, y)， 并 作为 函数 fanc lib0 的 返回 值 。 
其 运行 结果 为 3。 

@ 函数 的 递归 调用 

函数 在 执行 的 过 程 中 直接 或 间接 调用 自己 本 身 ， 称 为 递归 调用 。Python 语言 允许 递归 


[ 圆 1-7 求 1~5 的 平方 和 。 
def f(x): 
if x==1: # 递 归 调 用 结束 的 条 件 
return 1 
Slses 
return (f (x-1) +x*x) # 调 用 工 () 函数 本 身 
print (£ (5)) 
@ 模块 
通过 模块 (module) 能 够 有 逻辑 地 组 织 Python 代码 段 ， 把 相关 的 代码 


在 Python 中 ， 模 块 和 C 语言 中 的 头 文件 以 及 Java 中 的 包 很 类 似 ， 例 。 ”视频 讲解 


如 在 Python 中 要 调用 sqrt0 函 数 ， 必 须 用 import 关键 字 引 入 math 这 个 模块 。 


1) 导入 某 个 模块 
在 Python 中 用 关键 字 import 来 导入 某 个 模块 ， 方 式 如 下 : 
import 模块 名 # 导 入 模块 


例如 要 引用 模块 math， 就 可 以 在 文件 最 开始 的 地 方 用 import math 来 导入 。 
在 调用 模块 中 的 函数 时 必须 这 样 调用 : 

模块 名 .函数 名 

例如 : 


import math # 导 入 math 模块 
print ("50 的 平方 根 : "，math.sqrt (50)) 


为 什么 必须 加 上 模块 名 这 样 调用 呢 ? 因为 可 能 存在 这 样 一 种 情况 : 在 多 个 模块 中 含有 


相同 名 称 的 函数 , 此 时 如 果 只 是 通过 函数 名 来 调用 , 解释 器 无 法 知道 到 底 要 调用 哪个 函数 。 
所 以 如 果 像 上 述 这 样 导 入 模块 ， 调 用 函数 必须 加 上 模块 名 。 
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有 时 候 只 需要 用 到 模块 中 的 某 个 函数 , 此 时 只 要 引入 该 函数 即 可 , 通过 from 语句 实现 : 
from 模块 名 import 函数 名 1, 函数 名 2… 
通过 这 种 方式 引入 ， 在 调用 函数 时 只 能 给 出 函数 名 ， 不 能 给 出 模块 名 ， 但 是 当 两 个 模 


块 中 含有 相同 名 称 函 数 的 时 候 ， 后 面 一 次 引入 会 覆盖 前 一 次 引入 。 


也 就 是 说 ， 假 如 模块 A 中 有 函数 fun0， 在 模块 B 中 也 有 函数 fhn0， 如 果 引 入 A 中 的 


fun0 在 先 , B 中 的 fun0 在 后 , 那么 在 调用 fan0) 函 数 的 时 候 会 去 执行 模块 B 中 的 fun0 函 数 。 


如 果 想 一 次 性 导入 math 中 的 所 有 东西 ， 还 可 以 通过 以 下 语句 实现 : 
from math import * 


这 是 一 种 简单 的 导入 模块 中 所 有 项 目的 方式 ， 然 而 不 建议 过 多 地 使 用 这 种 方式 。 
2) 定义 自己 的 模块 

在 Python 中 ， 每 个 Python 文件 都 可 以 作为 一 个 模块 ， 模 块 的 名 字 就 是 文件 的 名 字 。 
比如 有 这 样 一 个 文件 fbopy， 在 fibo.py 中 定义 了 3 个 函数 add0、fib0、fib20: 


#fibo.py 
# 非 波 那 四 (Fibonacci) 数列 模块 
def fib(n): # 定 义 到 n 的 斐 波 那 契 数列 
a, b=0, 1 
while b<n: 
print(b, end=' ') 
a, b=b, a+b 
print () 
def fib2 (n) : # 返 回 到 m 的 斐 波 那 契 数列 
result=[] 
a, b=0, 1 
while b<n: 
result .append (b) 
a, b=b, a+b 
return result 
def add(a,b) : 
return a+b 


那么 在 其 他 文件 (例如 testpy) 中 就 可 以 如 下 使 用 : 


#test .py 

import fibo 

加 上 模块 名 称 来 调用 函数 : 

fibo.fib(1000) 结果 是 23 9506 1132213455 991440233 377 610 987 
fibo.fib2 (100) # 遇 厅 是 [1 1 2 3 5 8 13 21 34 5357 09] 
ER # 结 果 是 5 

当然 ， 也 可 以 通过 from fibo import add, fib, fib2 来 引入 。 

直接 通过 函数 名 来 调用 函数 : 
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fib (500) # 结 果 是 1 1 2 3 5 8 13 21 34 55 89 144 233 377 


如 果 想 列举 fibo 模块 中 定义 的 属性 ， 代 码 如 下 : 
import fibo 
dir (fibo) # 得 到 自 定义 模块 fibo 中 定义 的 变量 和 函数 


输出 结果 : 


I" name ", "fip", "Fib2", "add"] 


1.3 Python 面向 对 象 设计 


面向 对 象 程序 设计 (Object Oriented Programming，OOP) 的 思想 主要 针对 大 型 软件 设 
计 而 提出 ， 使 得 软件 设计 更 加 灵活 ， 能 够 很 好 地 支持 代码 复 用 和 设计 复 用 ， 并 且 使 得 代码 
具有 更 好 的 可 读 性 和 可 扩展 性 。 

现实 生活 中 的 每 一 个 相对 独立 的 事物 都 可 以 看 作 一 个 对 象 ， 例 如 一 个 人 、 一 辆 车 、 一 
台 计 算 机 等 。 对 象 是 具有 某 些 特性 和 功能 的 具体 事物 的 抽象 。 每 个 对 象 都 具有 描述 其 特征 
的 属性 及 附属 于 它 的 行为 。 例 如 ， 一 辆 车 有 颜色 、 车 轮 数 、 座 椅 数 等 属性 ， 也 有 启动 、 行 
驶 、 停 止 等 行为 ; 一 个 人 由 姓名 、 性 别 、 年 龄 、 身 高 、 体 重 等 特征 描述 ， 也 有 走路 、 说 话 、 
学 习 、 开 和 车 等 行为 ， 一 台 计 算 机 由 主机 、 显 示 器 、 键 盘 、 鼠 标 等 部 件 组 成 。 

在 人 们 生产 一 台 计 算 机 的 时 候 ， 并 不 是 先生 产 主机 再 生产 显示 器 再 生产 键盘 和 鼠标 ， 
即 不 是 顺序 执行 的 ， 而 是 分 别 生 产 设 计 主机 、 显 示 器 、 键 盘 、 鼠 标 等 ， 最 后 把 它们 组 装 起 
来 。 这 些 部 件 通过 事先 设计 好 的 接口 连接 ， 以 便 协调 地 工作 。 这 就 是 面向 对 象 程序 设计 的 
基本 思路 。 

每 个 对 象 都 有 一 个 类 型 ， 类 是 创建 对 象 实例 的 模板 ， 是 对 对 象 的 抽象 和 概括 ， 它 包含 

对 所 创建 对 象 的 属性 描述 和 行为 特征 的 定义 。 例 如, 马路 上 的 汽车 是 一 个 一 个 的 汽车 对 象 ， 
它们 归属 于 一 个 汽车 类 ， 那 么 车 身 颜色 就 是 该 类 的 属性 ， 开 动 是 它 的 方法 ， 该 保养 了 或 者 
该 报废 了 就 是 它 的 事件 。 
Python 完全 采用 了 面向 对 象 程序 设计 的 思想 ， 是 真正 面向 对 象 的 高 级 动态 编程 语言 ， 
完全 支持 面向 对 象 的 基本 功能 ， 例 如 封装 、 继 承 、 多 态 以 及 对 基 类 方法 的 覆盖 或 重 写 。 与 
其 他 面向 对 象 程序 设计 语言 不 同 的 是 ，Python 中 对 象 的 概念 很 广泛 ，Python 中 的 一 切 内 容 
都 可 以 称 为 对 象 。 例 如 ， 字 符 串 、 列 表 、 字 典 、 元 组 等 内 置 数据 类 型 都 具有 和 类 完全 相似 
的 语法 和 用 法 


1.3.1 定义 和 使 用 类 


@ 类 的 定义 

在 创建 类 时 用 变量 形式 表示 的 对 象 属性 称 为 数据 成 员 或 属性 (成 员 变 。 ”视频 讲解 
量 )， 用 函数 形式 表示 的 对 象 行为 称 为 成 员 函 数 〈 成 员 方 法 )， 成 员 属 性 和 成 员 方 法 统称 为 
类 的 成 员 。 

类 定义 的 最 简单 的 形式 如 下 : 
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class 类 名 : 
属性 (成 员 变 量 ) 
属性 
成 员 函 数 〈 成 员 方 法 ) 
例如 定义 一 个 Person 人 员 类 : 


class Person: 
num=1 # 成 员 变 量 ( 属 性) 
def SayHello(self) : # 成 员 函 数 
print ("Hello!"); 
这 里 在 Person 类 中 定义 了 一 个 成 员 函 数 SayHello(selfj， 用 于 输出 字符 串 "Hello!"。 同 
样 ，Python 使 用 缩 进 标 识 类 的 定义 代码 。 
@ 对 象 的 创建 
对 象 是 类 的 实例 。 如 果 人 类 是 一 个 类 ， 那 么 某 个 具体 的 人 就 是 一 个 对 象 。 只 有 定义 了 
具体 的 对 象 ， 才 能 通过 “对 象 名 .成 员 ” 的 方式 来 访问 其 中 的 数据 成 员 或 成 员 方 法 。 
Python 创建 对 象 的 语法 如 下 : 
对 象 名 = 类 名 () 
例如 ， 下 面 的 代码 定义 了 一 个 Person 类 的 对 象 p: 


p=Person () 
p.SayHello() # 访 问 成 员 函 数 SayHello () 


运行 结果 如 下 : 


Hello! 


1.3.2 ”构造 函数 


类 可 以 定义 一 个 特殊 的 称 为 。_init _0 的 方法 (构造 函数 ， 以 两 个 下 夯 线 “_ _” 开 头 
结束 )。 在 一 个 类 定义 了 __init _0 方 法 以 后 ， 类 实例 化 时 就 会 自动 为 新 生成 的 类 实例 调 
__init _0 方 法 ,构造 函数 一 般 用 于 完成 对 象 数 据 成 员 设 置 初 值 或 进行 其 他 必要 的 初始 化 工 
作 。 如 果 用 户 未 涉及 构造 函数 ，Python 将 提供 一 个 默认 的 构造 函数 。 

例如 定义 一 个 复数 类 Complex， 构 造 函数 完成 对 象 变量 的 初始 化 工作 。 


class Complex: 


沁 


def _ init _(self, realpart, imagpart): 
self.r=realpart 
self.i=imagpart 
x=Complex (3.0,-4.5) 


Print (zr Xi) 


运行 结果 如 下 : 
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1.3.3” 析 构 函 数 


Python 中 类 的 析 构 函数 是 _del _0， 用 来 释放 对 象 占用 的 资源 ， 在 Python 收回 对 象 
空间 之 前 自动 执行 。 如 果 用 户 未 涉及 析 构 函数 ，Python 将 提供 一 个 默认 的 析 构 函数 进行 必 
要 的 清理 工作 。 

例如 : 


class Complex: 


def init _(self, realpart, imagpart): 
self.r=realpart 
self.i=imagpart 

def _del _(self): 


print ("Complex 不 存在 了 ") 
X=Complex(3.0,-4.5) 
ED Te Rl) 
print (x) 


del x # 删 除 对 象 变量 x 
运行 结果 如 下 : 
= 


<_ main _.Complex object at 0x01F87C90> 
Complex 不 存在 了 


说 明 : 在 删除 对 象 变量 x 之 前 , x 是 存在 的 , 在 内 存 中 的 标识 为 0x01F87C90, 执行 “del 
x” 语 句 后 , 对 象 变 量 x 不 存在 了 ， 系统 自动 调用 析 构 函数 , 所 以 出 现 “Complex 不 存在 了 ” 
的 情况 。 


1.3.4 ”实例 属性 和 类 属性 


属性 (成 员 变量 ) 有 两 种 ， 一 种 是 实例 属性 ， 另 一 种 是 类 属性 〈 类 变量 )。 实 例 属性 
是 在 构造 函数 。_init _0 (以 两 个 下 画 线 “_ ”开头 和 结束 ) 中 定义 的 ， 定 义 时 以 self 作 
为 前 级 类 属性 是 在 类 中 方法 之 外 定义 的 属性 。 在 主 程序 中 (在 类 的 外 部 )， 实例 属性 属于 
实例 (对象)。 只 能 通过 对 象 名 访问 ， 类 属性 属于 类 ， 可 以 通过 类 名 访问 ， 也 可 以 通过 对 象 
名 访问 ， 为 类 的 所 有 实例 共享 。 

[ 男 ]1-8 定义 含有 实例 属性 (姓名 name、 年 龄 age) 和 类 属性 (人 数 num) 的 Person 
(人 员 ) 类 。 


class Person: 


num=1 # 类 属性 
def _ init _(self, str,n): # 构 造 函 数 
self.name=str # 实 例 属性 


self.age=n 
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def SayHello (self): # 成 员 函 数 
print ("Hello!") 
def PrintName (self): # 成 员 函 数 
print (" 姓 名 : "，self .name， "年 龄 : "，self.age) 
def PrintNum(self) : # 成 员 函 数 


print (Person.num) 


## 由 于 是 类 属性 ， 所 以 不 写 self .num 


# 主 程序 

P1=Person (" 夏 敏捷 ", 42) 
P2=Person (" 王 琳 ",36) 
P1.PrintName () 
P2.PrintName () 

Person .num=2 
P1.PrintNum() 
P2.PrintNum() 


运行 结果 如 下 : 


姓名 :” 夏 敏捷 年 龄 : 42 
姓名 : 王 琳 年 龄 : 36 
2 
区 


num 变量 是 一 个 类 变量 ， 它 的 值 将 在 这 个 类 的 所 有 实例 之 间 共享 。 用 户 可 以 在 类 内 部 
或 类 外 部 使 用 Person. num 访问 。 

在 类 的 成 员 函 数 〈 方 法 ) 中 可 以 调用 类 的 其 他 成 员 函 数 〈 方 法 )， 可 以 访问 类 属性 、 
对 象 实例 属性 。 

在 Python 中 比较 特殊 的 是 , 可 以 动态 地 为 类 和 对 象 增加 成 员 , 这 一 点 是 和 很 多 面向 对 
象 程序 设计 语言 不 同 的 ， 也 是 Python 动态 类 型 特点 的 一 种 重要 体现 。 


1.3.5 ”私有 成 员 与 公有 成 员 


了 Python 并 没有 对 私有 成 员 提供 严格 的 访问 保护 机 制 。 在 定义 类 的 属性 时 ， 如 果 属 性 名 
以 两 个 下 画 线 “_ ”开头 ， 表 示 是 私有 属性 ， 否 则 是 公有 属性 。 私 有 属性 在 类 的 外 部 不 能 
直接 访问 , 需要 通过 调用 对 象 的 公有 成 员 方 法 来 访问 , 或 者 通过 Python 支持 的 特殊 方式 来 
访问 。Python 提供 了 访问 私有 属性 的 特殊 方式 ， 可 用 于 程序 的 测试 和 调试 ， 对 于 成 员 方 法 
也 具有 同样 的 性 质 。 这 种 方式 如 下 : 

对 象 名 . _ 类 名 + 私有 成 员 
例如 访问 Car 类 私有 成 员 __weight: 
carl. Car weight 


私有 属性 是 为 了 数据 封装 和 保密 而 设 的 属性 ， 一 般 只 能 在 类 的 成 员 方法 〈 类 的 内 部 ) 
中 使 用 访问 , 虽然 Python 支持 一 种 特殊 的 方式 从 外 部 直接 访问 类 的 私有 成 员 , 但 是 并 不 推 


# 修 改 类 属性 
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荐 大 家 这 样 做 。 公 有 属性 是 可 以 公开 使 用 的 ， 既 可 以 在 类 的 内 部 进行 访问 ， 也 可 以 在 外 部 
程序 中 使 用 。 
贺 19 为 Car 类 定义 私有 成 员 。 


class Car: 
price=100000 # 定 义 类 属性 
def _ init _(self; CE Ww): 
self.color=c # 定 义 公 有 属性 color 
self. _ weight=w # 定 义 私有 属性 ”weight 
# 主 程序 
carl=Car ("Red",10.5) 
car2=Car ("Blue",11.8) 


print (carl.color) 


print(carl. __ Car weight) 

print(carl. __weight) #AttributeError 
运行 结果 如 下 : 

Red 

Oe 

AttributeError: "Car' object has no attribute '_ weight' 


全 3.6” 万 法 


在 类 中 定义 的 方法 可 以 粗略 地 分 为 3 大 类 ， 即 公有 方法 、 私 有 方法 、 静 态 方法 。 其 中 ， 
公有 方法 、 私 有 方法 都 属于 对 象 ， 私 有 方法 的 名 字 以 两 个 下 画 线 “__” 开 始 ， 每 个 对 象 都 
有 自己 的 公有 方法 和 私有 方法 ， 在 这 两 类 方法 中 可 以 访问 属于 类 和 对 象 的 成 员 ， 公 有 方法 
通过 对 象 名 直接 调用 ， 私 有 方法 不 能 通过 对 象 名 直接 调用 ， 只 能 在 属于 对 象 的 方法 中 通过 
self 调用 或 在 外 部 通过 Python 支持 的 特殊 方式 来 调用 。 如 果 通 过 类 名 来 调用 属于 对 象 的 公 
有 方法 ， 需 要 显 式 地 为 该 方法 的 self 参数 传递 一 个 对 象 名 ， 用 来 明确 指定 访问 哪个 对 象 的 
数据 成 员 。 静 态 方法 可 以 通过 类 名 和 对 象 名 调用 ， 但 不 能 直接 访问 属于 对 象 的 成 员 ， 只 能 
访问 属于 类 的 成 员 。 

贺 1-10 公有 方法 、 私 有 方法 、 静 态 方法 的 定义 和 调用 。 

class Fruit: 

price=0 
def _ init _(self): 


self. _color='Red' # 定 义 和 设 置 私有 属性 color 
self. city='Kunming' ## 定 义 和 设 置 私有 属性 city 

def outputColor (self) : # 定 义 私有 方法 outputcolor () 
print (self. _color) # 访 问 私 有 属性 color 

def _ outputCcity (self): # 定 义 私 有 方法 outputcity () 

print (self. city) # 访 问 私 有 属性 city 

def output (self): # 定 义 公 有 方法 output () 

self._ outputcolor() 砷 调用 私有 方法 outputcolor () 
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self. outputCcity() # 调 用 私有 方法 outputcity() 
@ staticmethod 
def getPrice() : # 定 义 静 态 方法 getPrice () 


return Fruit.price 
@ staticmethod 
def setPrice(p) : # 定 义 静 态 方法 setPrice () 
Fruit.price=p 

# 主 程序 
apple=Fruit () 
apple.output () 
print (Fruit.getPrice ()) 
Fruit.setPrice(9) 
print (Fruit.getPrice()) 


运行 结果 如 下 : 


Red 
Kunming 
0 

| 


继承 是 为 代码 复 用 和 设计 复 用 而 设计 的 ， 是 面向 对 象 程序 设计 的 重要 特性 之 一 。 在 设 
计 一 个 新 类 时 ， 如 果 可 以 继承 一 个 已 有 的 设计 良好 的 类 ， 然 后 进行 二 次 开发 ， 无 疑 会 大 幅 
度 减少 开发 的 工作 量 。 


1.3.7 ”类 的 继承 


在 继承 关系 中 ， 已 有 的 、 设 计 好 的 类 称 为 父 类 或 基 类 ， 新 设计 的 类 称 
为 子 类 或 派生 类 。 派 生 类 可 以 继承 父 类 的 公有 成 员 ， 但 是 不 能 继承 其 私有 
成 员 。 
类 继承 的 语法 格式 如 下 : 视频 讲解 
class 派生 类 名 ( 基 类 名 ) : # 基 类 名 写 在 括号 里 
派生 类 成 员 


在 Python 中 继承 有 以 下 特点 : 

(1) 在 继承 中 基 类 的 构造 函数 〈( __init _0 方 法 ) 不 会 被 自动 调用 ， 它 需要 在 其 派生 
类 的 构造 中 专门 调用 。 

(2) 如 果 需 要 在 派生 类 中 调用 基 类 的 方法 ， 通 过 “ 基 类 名 .方法 名 0” 的 方式 来 实现 ， 
需要 加 上 基 类 的 类 名 前 级 ， 且 需要 带 上 self 参数 变量 (在 类 中 调用 普通 函数 时 并 不 需要 带 
上 self 参数 )， 也 可 以 使 用 内 置 函数 super() 实 现 这 一 目的 。 

(3) Python 总 是 先 查 找 对 应 类 型 的 方法 ， 如 果 不 能 在 派生 类 中 找到 对 应 的 方法 ， 它 才 
开始 到 基 类 中 逐个 查找 〈 先 在 本 类 中 查找 调用 的 方法 ， 找 不 到 才 去 基 类 中 找 )。 

[加 1-1 设计 Person 类 , 并 根据 Person 派生 Student 类 , 分 别 创建 Person 类 与 Student 
类 的 对 象 。 
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从 入 门 到 实战 一 一 爬虫 、 游 戏 和 机 器 学 习 


# 定 义 基 类 : Person 类 
import types 
class Person (object) :# 基 类 必须 继承 于 opject， 否 则 在 派生 类 中 将 无 法 使 用 super () 函数 
def _ init _(self, name='', age=20, sex="'man'): 
self.setName (name) 
self.setAge (age) 
self.setSex (sex) 
def setName (self, name): 


if type (name) !=str: # 内 置 函数 type () 返回 被 测 对 象 的 数据 类 型 
print (' 姓 名 必须 是 字符 串 .' ) 
return 


self. name=name 
def setAge(self, age): 
if type (age) !=int: 
print ( "年龄 必须 是 整 型 . ') 
return 
self. _age=age 
def setSex(self, sex): 
if sex!=' 男 ' and sex!=' 女 ': 
print (' 性 别 输入 错误 ') 
return 
self._ _sex=sex 
def show(self) : 
print (' 姓 名 : '，self. name，' 年 龄 ，'，self. _age ，' 性 别 : '，self. _sex) 
# 定 义 子 类 (student 类 )， 在 其 中 增加 一 个 入 学 年 份 私 有 属性 数据 成 员 ) 
class Student (Person): 
def _ init _(self, name='', age=20, sex='man', schoolyear=2016): 
# 调 用 基 类 构造 方法 初始 化 基 类 的 私有 数据 成 员 
Super (Student, self)._ init _(name, age, sex) 
#Person. init (self，name，age，sex)# 也 可 以 这 样 初始 化 基 类 的 私有 数据 成 员 
self.setschoolyear (schoolyear) # 初 始 化 派生 类 的 数据 成 员 
def setSchoolyear (self，schoolyear) : 
self._ _schoolyear=schoolyear 
def show(self) : 


Person.show(self) # 调 用 基 类 的 show () 方 法 
#super (Student，self) .show() ## 也 可 以 这 样 调用 基 类 的 show () 方 法 
print (' 入 学 年 份 : '，self.__schoolyear) 

# 主 程序 

if _ name =="'_ main _': 


zhangsan=Person(' 张 三 '"，19，' 男 ') 
zhangsan.show () 

1isi=student (' 李 四 '，18，' 男 '，2015) 
1isi.show() 


lisi.setAge (20) # 调 用 继承 的 方法 修改 年 龄 


1isi.show() 
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运行 结果 如 下 : 
姓名 :” 张 三 年 龄 : 19 性 别 : 男 
姓名 :” 李 四 年 龄 : 18 性 别 : 男 
入 学 年 份 : 2015 
姓名 :” 李 四 年 龄 : 20 性 别 : 男 
入 学 年 份 : 2015 


方法 重 写 必须 出 现在 继承 中 。 它 是 指 在 派生 类 继承 了 基 类 的 方法 之 后 ， 如 果 基 类 方法 
的 功能 不 能 满足 需求 ， 需 要 对 基 类 中 的 某 些 方法 进行 修改 。 用 户 可 以 在 派生 类 中 重 写 基 类 
的 方法 ， 这 就 是 重 写 。 

贺 1-12 重 写 父 类 〈 基 类 ) 的 方法 。 

class Rnimal: # 定 义 父 类 


def run(self) : 
print (Animal is running...)  # 调 用 父 类 方法 


class Cat (Animal) : # 定 义 子 类 
def run(self) : 
print (Cat is running...) # 调 用 子 类 方法 
class Dog (Animal): # 定 义 子 类 
def run(self) : 
print(Dog is running...) # 调 用 子 类 方法 
c=Dog () # 子 类 实例 
c.run() # 子 类 调用 重 写 方法 


程序 运行 结果 : 

Dog is running... 

当 子 类 Dog 和 父 类 Animal 存在 相同 的 run0 方 法 时 ， 子 类 的 ran0 覆 盖 了 父 类 的 run0)， 
在 代码 运行 时 总 是 会 调用 子 类 的 ran0， 这 样 就 获得 了 继承 的 另 一 个 优点 一 一 多 态 。 


1.3.8 多 态 


要 理解 什么 是 多 态 , 首先 要 对 数据 类 型 再 做 一 点 说 明 :在 定义 一 个 class ” 回 i 
的 时 候 ， 实 际 上 就 定义 了 一 种 数据 类 型 。 通 常 ， 定 义 的 数据 类 型 和 Python ”视频 讲解 
自 带 的 数据 类 型 (例如 string、list、dict) 没什么 区 别 。 


a=113t() #a 是 1ist 类 型 
b=Animal () #b 是 Animal 类 型 
c=Dog () #c 是 Dog 类 型 


一 个 变量 是 否 为 某 个 类 型 可 以 用 isinstance() 判 断 : 


>>> isinstance(a, list) 


True 
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Dog 


以 被 


从 入 门 到 实战 一 一 惟 虫 、 游 戏 和 机 器 学 习 


>>> isinstance(b, Animal) 
True 
>>> isinstance(c, Dog) 


True 
a、b、c 确实 对 应 list、Animal、Dog 这 3 种 类 型 。 


>>> isinstance(c, Animal) 
True 


因为 Dog 是 从 Animal 继承 的 ， 当 创建 了 一 个 Dog 的 实例 c 时 ， 认 为 c 的 数据 类 型 是 
没 错 ， 但 c 同时 也 是 Animal，Dosg 本 来 就 是 Animal 的 一 种 。 

所 以 ， 在 继承 关系 中 ， 如 果 一 个 实例 的 数据 类 型 是 某 个 子 类 ， 那 么 它 的 数据 类 型 也 可 
看 作 是 父 类 。 但 是 ， 反 过 来 就 不 可 以 : 

>>> b=Animal () 

>>> isinstance(b, Dog) 

False 

Dog 可 以 看 成 Animal， 但 Animal 不 可 以 看 成 Dog。 

要 理解 多 态 的 好 处 ， 还 需要 再 编写 一 个 函数 ， 这 个 函数 接受 一 个 Animal 类 型 的 变量 : 


def run twice (animal) : 


animal.run() 
animal.run() 


当 传 入 Animal 的 实例 时 ，run_twice0 就 打印 出 : 


>>> run twice (Animal ()) 
Animal is running... 
Animal is running... 


当 传 入 Dog 的 实例 时 ，run_twice0 就 打印 出 : 


>>> run twice (Dog () ) 
Dog is running... 
Dog is running... 


当 传 入 Cat 的 实例 时 ，run_twice(0) 就 打印 出 : 


>>> run twice(Cat()) 
Cat is running... 
Cat is running... 


现在 ， 如 果 再 定义 一 个 Tortoise 类 型 ， 也 从 Animal 派生 : 


class Tortoise (Animal): 
def run(self) : 
print('Tortoise is running slowly...') 


用 run_ twice0 时 传 入 Tortoise 的 实例 : 


>>> run twice (Tortoise()) 
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Tortoise is running slowly... 


Tortoise is running slowly... 


大 家 会 发 现 新 增 了 一 个 Animal 的 子 类 , 不 必 对 run_twice0) 做 任何 修改 。 实际 上 , 任何 
依赖 Animal 作为 参数 的 函数 或 者 方法 都 可 以 不 加 修改 地 正常 运行 ， 原 因 就 在 于 多 态 。 

多 态 的 好 处 就 是 ， 当 需要 传 入 Dog、Cat、Tortoise 等 时 ， 只 需要 接收 Animal 类 型 就 可 
以 了 ， 因 为 Dog、Cat、Tortoise 等 都 是 Animal 类 型 ， 然 后 按照 Animal 类 型 进行 操作 。 由 
于 Animal 类 型 有 run() 方 法 ， 因 此 传 入 的 任意 类 型 ， 只 要 是 Animal 类 或 者 子 类 ， 就 会 自动 
调用 实际 类 型 的 run() 方 法 ， 这 就 是 多 态 的 意思 。 

对 于 一 个 变量 ， 用 户 只 需要 知道 它 是 Animal 类 型 ， 无 须 确切 地 知道 它 的 子 类 型 ， 就 
可 以 放心 地 调用 run() 方 法 , 而 具体 调用 的 run() 方 法 是 作用 在 Animal、Dog、Cat 还 是 Tortoise 
对 象 上 ， 由 运行 时 该 对 象 的 确切 类 型 决定 ， 这 就 是 多 态 真正 的 威力 : 调用 方 只 管 调 用 ， 不 
管 细 节 ， 而 当 新 增 一 种 Animal 的 子 类 时 ， 只 要 确保 run() 方 法 编写 正确 ， 不 用 管 原来 的 代 
码 是 如 何 调用 的 。 这 就 是 著名 的 “ 开 闭 ”原则 ， 包 括 以 下 两 点 。 

(1) 对 扩展 开放 : 允许 新 增 Animal 子 类 。 

(2) 对 修改 封闭 : 不 需要 修改 依赖 Animal 类 型 的 run_twice() 等 函数 。 


1.3.9 面向 对 象 应 用 案例 一 一 扑克 牌 发 牌 程序 


【案例 】 采 用 扑克 牌 类 设计 扑克 牌 发 牌 程序 。 

4 名 牌 手打 牌 ， 计 算 机 随机 将 52 张 牌 〈 不 含 大 /小 鬼 ) 发 给 4 名 牌 手 ， 并 在 屏幕 上 显 
示 每 位 牌 手 的 牌 。 程 序 的 运行 效果 如 图 1-5 所 示 。 
[8 "Python 350 She 
He Edshell Debug = Optons = indow= Help- 


Python 3.5.0 01f4567，Sep 13,2015, 02:27:37) [MSC v.1900 64 bit (ALD64)] on win32 
“copyrigl 条 )” for mcre information. 


s” or “license( 


in: slcotol 


图 1-5 扑克 有 牌 发 牌 程序 的 运行 效果 


发 牌 程序 设计 出 3 个 类 一 一 Card 类 、Hand 类 和 Poke 类 。 

@ Card 类 

Card 类 代表 一 张 牌 , 其 中 FaceNum 字段 指 的 是 牌 面 数字 1 一 13, Suit 字段 指 的 是 花色 ， 
值 “ 梅 ”为 梅花 、“ 方 ”为 方 钼 、“ 红 ”为 红心 、“ 黑 ”为 黑 桃 。 

(1) Card 构造 函数 根据 参数 初始 化 封装 的 成 员 变量 ， 实 现 牌 面 大 小 和 花色 的 初始 化 ， 
以 及 是 否 显示 牌 面 ， 默 认 True 为 显示 牌 的 正面 。 

(2) __str _0 方 法 用 来 输出 牌 面 大 小 和 花色 。 

(3) pic_order() 方 法 获取 牌 的 顺序 号 ， 牌 面 按 梅 花 1 一 13 一 方块 14~26 一 红 桃 27 一 
39 一 黑 桃 40 一 52 的 顺序 编号 (未 洗 牌 之 前 )。 也 就 是 说 ， 梅 花 2 的 顺序 号 为 2， 方 块 A 的 
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从 入 门 到 实战 一 一 爬虫 、 游 戏 和 机 器 学 习 

顺序 号 为 14， 方块 K 的 顺序 号 为 26。 这 个 方法 是 为 图 形 化 显示 牌 面 预 留 的 方法 。 
(4) flip0 是 翻 牌 方法 ， 改 变 牌 面 是 否 显示 的 属性 值 。 
#Cards Module 
class Card(): 


mm A playing card. "nn 
RANKS=["A", "2", "3", Am, "Sm, "6", "7", 

m8", “on, "10", wj", "OQ", wK"] # 牌 面 数字 1 一 13 
SUITS=[" 梅 "，" 方 "，" 红 "，" 黑 "] #" 梅 "为 梅花 ，" 方 "为 方 钼 ，" 红 "为 红心 ，" 黑 "为 黑 桃 


def _ init _(self, rank, suit, face up=True): 
self.rank=rank # 指 的 是 牌 面 数字 1 一 13 
self.suit=suit # 指 的 是 花色 
self.is_face up=face_up # 是 否 显示 牌 的 正面 ，True 为 正面 False 为 背面 


def str (self): # 重 写 print () 方 法 ， 打 印 一 张 牌 的 信息 
if self.is face up: 
rep=self.suit+self.rank 
SLses 
rep="XX" 
return rep 


def pic order(self): # 牌 的 顺序 号 
if self.rank=="A": 
FaceNum=1 


elif self.rank=="J": 
FaceNum=11 

elif self.rank=="Q": 
FaceNum=12 

elif self.rank=="K": 
FaceNum=13 

Isa 
FaceNum=int (self.rank) 

if self.suit==" 梅 ": 
Suit=1 

elif self.suit=—" 方 ": 
Suit=2 

elif self.suit==" 红 ": 
Suit=3 

else: 
Suit=4 

return (Suit-1)*13+FaceNum 


def flip(self) : # 翻 牌 方法 
self.is face up=not self.is face up 
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@ Hand 类 
Hand 类 代表 一 手 牌 (一 个 玩家 手 里 拿 的 牌 ), 可 以 认为 是 一 位 牌 手 手 里 的 牌 , 其 中 cards 
列表 变量 存储 牌 手 手 里 的 牌 。 玩 家 可 以 增加 牌 、 清 空手 里 的 牌 、 把 一 张 牌 给 其 他 牌 手 。 


class Hand() : 


"ww A hand of playing cards. "ww 
def init _(self): 
self.cards=[] #cards 列表 变量 存储 牌 手 的 牌 
def _ str _ (self) : # 重 写 print () 方 法 ， 打 印 出 牌 手 的 所 有 牌 
if self.cards: 
rep="" 
for card in self.cards: 
rep+=str (card)+"\t" 
[2 
rep=" 无 牌 " 
return rep 
def clear(self): # 清 空手 里 的 牌 
self.cards=[] 
def add(self, card): # 增 加 有 牌 
self.cards.append (card) 
def give(self，card，other hand) : # 把 一 张 牌 给 其 他 牌 手 
self.cards.remove (card) 
other hand.add (card) 


© Poke 类 
Poke 类 代表 一 副 牌 , 可 以 看 作 是 有 52 张 牌 的 牌 手 , 所 以 继承 Hand 类 。 由 于 其 中 cards 
列表 变量 要 存储 52 张 牌 ， 而且 要 发 牌 、 洗 牌 ， 所 以 增加 如 下 方法 : 
(1) populate(selb 生 成 存储 了 52 张 牌 的 一 手 牌 ， 当 然 这 些 牌 是 按 梅 花 1 一 13 一 方块 
14 一 26 一 红 桃 27 一 39 一 黑 桃 40 一 52 的 顺序 〈 未 洗 牌 之 前 ) 存储 在 cards 列表 变量 中 。 
(2) shufhle(self) 洗 牌 ， 使 用 Python 的 random 模块 的 shuffle() 方 法 打 乱 牌 的 存储 顺序 
即 可 。 
(3) deal(self hands，per hand=13) 是 完成 发 牌 动作 ， 发 给 4 个 玩家 ， 每 人 默认 13 张 
牌 。 当 然 ， 如 果 给 per_ hand 传 10， 则 每 人 发 10 张 牌 ， 只 不 过 牌 没 发 完 而 已 。 
#Poke 类 
class Poke (Hand): 
""" A deck of playing cards. """ 
def populate (self) : # 生 成 一 副 牌 
for suit in Card-SUITS : 
for rank in Card.RANKS: 
self.add (Card (rank, suit)) 


def shuffle (self) : # 洗 牌 
import random 
random.shuffle (self .cards) # 打 乱 牌 的 顺序 
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从 入 门 到 实战 一 一 仆 虫 、 游 戏 和 机 器 学 习 
def deall(self, hands, per hand=13): # 发 牌 ， 发 给 玩家 ， 每 人 默认 13 张 牌 


for rounds in range (per hand) : 
for hand in hands: 

if self.cards: 
top card=self.cards[0] 
self.cards.remove (top card) 
hand.add (top card) 
#self.give (top card，hand) # 上 两 句 可 以 用 此 语句 替换 

全 ESS 


print ("不 能 继续 发 牌 了 ， 牌 已 经 发 完 !") 


@ 主 程序 

主 程序 比较 简单 ， 因 为 有 4 个 玩家 ， 所 以 生成 players 列表 存储 初始 化 的 4 位 牌 手 。 生 
成 一 副 牌 对 象 实例 pokel， 调 用 populate() 方 法 生成 有 52 张 牌 的 一 副 牌 ， 调 用 shuffle() 方 法 
洗 牌 打 乱 顺序 ， 调 用 deal(players,13) 方 法 发 给 玩家 每 人 13 张 牌 ， 最 后 显示 4 位 牌 手 所 有 


的 牌 。 
# 主 程序 
if _ name ==" main _": 


1.4 


print ("This is a module with classes for playing cards.") 
#4 个 玩家 

players=[Hand(),Hand(),Hand(),Hand()] 

pokel=Poke () 


pokel .populate () # 生 成 一 副 牌 
pokel.shuffle() # 洗 牌 

pokel.deal (players, 13) # 发 给 玩家 每 人 13 张 牌 
# 显 示 4 位 牌 手 的 牌 

n=1 


for hand in players: 
print (" 牌 手 ",n,end=":") 
print (hand) 
n=n+1 
input ("\nPress the enter key to exit.") 


Python 图 形 界面 设计 


Python 提供 了 多 个 图 形 开发 界面 的 库 ， 几 个 常用 的 Python GUI 库 如 下 。 

(1) Tkinter: Tkinter 模块 (Tk 接口 ) 是 Python 的 标准 Tk GUI 工具 包 的 接口 。Tkinter 
可 以 在 大 多 数 Unix 平台 下 使 用 ， 同 样 可 以 应 用 在 Windows 和 Macintosh 系统 里 。Tk8.0 的 
后 续 版 本 可 以 实现 本 地 窗口 风格 ， 并 良好 地 运行 在 绝 大 多 数 平台 中 。 

(2) wxPython: wxPython 是 一 款 开源 软件 ， 是 Python 语言 的 一 套 优秀 的 GUI 图 形 库 ， 
允许 Python 程序 员 很 方便 地 创建 完整 的 、 功 能 键 全 的 GUI 用 户 界 面 。 
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(3) Jython: Jython 程序 可 以 和 Java 无 颖 集成 。 除 了 一 些 标准 模块 以 外 ，Jython 使 用 
Java 的 模块 。Jython 几乎 拥有 标准 的 Python 中 不 依赖 于 C 语言 的 全 部 模块 。 例 如 ，Jython 


的 用 户 界 


i 使 用 Swing、AWT 或 者 SWT。Jython 可 以 被 动态 或 静态 地 编译 成 Java sh 


Tkinter 是 Python 的 标准 GUI 库 。 由 于 Tkinter 是 内 置 到 Python 的 安装 包 中 ， 


装 好 Python， 之 后 就 能 import Tkinter 库 ， 而 且 IDLE 也 是 用 Tkinter 编写 而 成 ， ai 


面 ，Tkinter 还 是 能 应 付 自 如 的 ， 使 用 Tkinter 可 以 快速 地 创建 GUI 用 和 本 


书 主要 使 用 Tkinter 设计 图 形 界 面 。 

1.4.1 创建 Windows 窗口 
[ 贺 1-13 使 用 Tkinter 创建 一 个 Windows 窗口 的 GUI 程序。 视频 讲解 
import tkinter # 导 入 Tkinter 模块 
win=tkinter.Tk() # 创 建 Windows 窗口 对 象 
win.title(' 我 的 第 一 个 GUI 程序 ') # 设 置 窗口 标题 
win.mainloop () ## 进 入 消息 循环 ， 也 就 是 显示 窗口 


以 上 ff 


方便 地 创建 Windows 窗口 。 

在 创建 Windows 窗口 对 象 之 后 ， 可 以 使 用 geometry() 方 
法 设置 窗口 的 大 小 ， 格 式 如 下 : 

窗口 对 象 .geometry ("size") 


尺码 的 执行 结果 如 图 1-6 所 示 ， 可 见 Tkinter 可 以 很 sem EI 于 


size 用 于 指定 窗口 大 小 ， 格 式 如 下 : 图 1-6 Tkinter 创建 一 个 窗口 


宽度 之 


Wl 


from 


高 度 ”〈 注 : x 是 小 写字 母 ， 不 是 乘 号 ) 
14 显示 一 个 Windows 窗口 ， 初 始 大 小 为 800 X600。 


tkinter import * 


win=Tk (); 
win.geometry ("800x600") 
win.mainloop(); 


另外 ， 
最 大 尺寸 


还 可 以 使 用 minsize0 方 法 设置 窗口 的 最 小 尺寸 , 使 用 maxsize( 方 法 设置 窗口 的 
方法 如 下 : 


窗口 对 象 . minsize ("最 小 宽度 x 最 小 高 度 ") 
窗口 对 象 . maxsize ("最 大 宽度 x 最 大 高 度 ") 


例如 : 


win. minsize ("400x600") 
win. maxsize ("1440x800") 


1.4.2 


Tkinter 几何 布局 管理 器 (Geometry Manager) 用 于 组 织 和 管理 父 组 件 〈 往 往 是 窗口 ) 


几何 布局 管理 器 
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| 这 要 项 目 案例 开发 
从 入 门 到 实战 一 一 仆 虫 、 游 戏 和 机 器 学 习 


中 子 组 件 的 布局 方式 。Tkinter 提 供 了 3 种 不 同 风 格 的 几何 布局 管理 类 , 即 pack、grid 和 place。 


@ pack 几何 布局 管理 器 
pack 几何 布局 管理 器 采 上 
其 放 在 快速 生成 的 界面 中 。 


块 的 方式 组 织 组 件 , pack 布局 根据 子 组 件 创 建生 成 的 顺序 将 


调用 子 组 件 的 方法 pack0， 则 该 子 组 件 在 其 父 组 件 中 采用 pack 布局 : 


pack (option=value, ...) 


pack() 方 法 提供 了 如 表 1-1 所 示 的 若干 参数 选项 。 


表 1-1 pack() 方 法 提供 的 参数 选项 

选 项 描述 取 值 范 
side 停靠 在 父 组 件 的 哪 一 边 上 "top' (默认 值 )、'bottom'、'left、'right 

四 停靠 位 置 ， 对 应 于 东 、 南 、 西 、 北 以 及 4 | '、's'、'e'、'W'、'hWw'、'sw'、'se'、'ne'、'center' 
人 | 个 朋 (默认 值 ) 
fill 填充 空间 x'、'y'、'"both'、'none' 
expand 扩展 空间 0 或 1 
ipadx 、 站 二 人 单位 为 c (厘米 )、m (毫米 )、i (英寸 )、p ( 打 
dt 组 件 内 部 在 x/y 方向 上 填充 的 空间 大 小 印 机 的 点 ) 
padx、pady | 组 件 外 部 在 xyy 方向 上 填充 的 空间 大 小 i 人 


贺 1-15 pack 几何 布局 管理 器 的 GUI 程序 ， 运 行 效果 如 图 1-7 所 示 。 


import tkinter 
Foot=tkinter.TK() 
label=tkinter.Label (root, text='hello, python') 
label .pack () # 将 Label 组 件 添加 到 窗口 中 显示 
buttonl=tkinter.Button (root, text="'BUTTON]1') 

# 创 建文 字 是 “BUTTON1” 的 Button 组 件 
buttonl.pack (side=tkinter .LEFT) 

# 将 buttonl 组 件 添加 到 窗口 中 显示 ， 左 停靠 
button2=tkinter.Button (root, text="'BUTTON2') 

# 创 建文 字 是 “BUTTON2” 的 Button 组 件 
button2.pack (side=tkinter.RIGHT) 

# 将 button2 组 件 添加 到 窗口 中 显示 ， 右 停靠 


root .mainloop () 


@ grid 几何 布局 管理 器 


(tk ed 


grid 几何 布局 管理 器 采用 表格 结构 组 织 组 件 。 子 组 件 的 
位 置 由 行 / 列 确定 的 单元 格 决 定 , 子 组 件 可 以 跨越 多 行 / 列 。 在 
每 一 列 中 ， 列 宽 由 这 一 列 中 最 宽 的 单元 格 确定 。grid 几何 布 
局 管理 器 适合 表现 表格 形式 的 布局 ， 可 以 实现 复杂 的 界面 ， 


BUTTON1 


BUTTON2 


因而 被 广泛 采用 。 


调用 子 组 件 的 grid0 方 法 , 则 该 子 组 件 在 其 父 组 件 中 采用 。 图 1-7 pack 几何 布局 管理 器 


grid 几何 布局 : 
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grid(option=value,...) 
grid() 方 法 提供 了 如 表 1-2 所 示 的 若干 参数 选项 。 
表 1-2 grid() 方 法 提供 的 参数 选项 


选 项 描述 取 值 范围 

和 组 件 紧 贴 所 在 单元 格 的 某 一 边 角 ， 对 应 | 鄙 、'S、'e、'W、mw'、'swW'、'se'、me'、'center 

Sb 于 东 、 南 、 西 、 北 以 及 4 个 角 (默认 值 ) 

IOW 单元 格 行 号 整数 

column 单元 格 列 号 整数 

IOWSpan 行 跨度 整数 

columnspan | 列 跨度 整数 

ipadx、 ipady | 组 件 内 部 在 xyy 方向 上 填充 的 空间 大 小 es m (毫米 )、i( 美 寸 )、p ( 打 
二 二 二 

padx、pady | 组 件 外 部 在 x/y 方向 上 填充 的 空间 大 小 i mm (毫米 )、i( 美 寸 )、p ( 打 


grid 几何 布局 管理 器 有 两 个 最 为 重要 的 参数 ， 一 个 是 row， 男 一 个 是 column， 用 来 指 
定 将 子 组 件 放置 到 什么 位 置 ， 如 果 不 指定 row， 会 将 子 组 件 放 置 到 第 1 个 可 用 的 行 上 ， 如 
果 不 指定 column， 则 使 用 第 0 列 〈 首 列 )。 

[ 圆 1-16 grid 几何 布局 管理 器 的 GUI 程序 ， 运 行 效果 如 图 1-8 所 示 。 


from tkinter import * 

root=TKk () 

#200x200 代表 了 初始 化 时 主 窗口 的 大 小 ，280 和 280 代表 了 初始 化 时 窗口 所 在 的 位 置 
root .geometry('200x200+280+280"') 

root.title(' 计 算 器 示例 ') 

#grid (网 格 ) 布局 

L1=Button (root, text='1', width=5, bg='yellow') 
L2=Button (root, text='2', width=5) 

L3=Button (root, text='3', width=5) 

L4=Button (root, text='4', width=5) 

L5=Button (root, text='5', width=5, bg='green') 
L6=Button (root, text='6', width=5) 

L7=Button (root, text="'7', width=5) 

L8=Button (root, text="'8', width=5) 

L9=Button (root, text="'9', width=5, bg="'yellow') 
L0=Button (root, text="'0') 

Lp=Button (root, text="'.') 

L1.grid (row=0, column=0) # 按 钮 放置 在 0 行 0 列 
L2.grid (row=0, column=1) # 按 钮 放置 在 0 行 1 列 
L3.grid (row=0, column=2) # 按 钮 放置 在 0 行 2 列 
L4.grid (row=1, column=0) # 按 钮 放置 在 1 行 0 列 
L5.grid(row=1, column=1) # 按 钮 放置 在 1 行 1 列 
L6.grid(row=1, column=2) # 按 钮 放置 在 1 行 2 列 
L7.grid(row=2, column=0) 坦 按钮 放置 在 2 行 0 列 
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| 语 要 项 目 案例 开发 
从 入 门 到 实战 一 一 仆 虫 、 游 戏 和 机 器 学 习 
L8.grid(row=2, column=1) # 按 钮 放置 在 2 行 1 列 
L9.grid(row=2, column=2) # 按 钮 放置 在 2 行 2 列 
L0.grid(row=3, column=0, columnspan=2,sticky=E+W) # 跨 两 列 ， 左 右 贴 紧 
Lp.grid (row=3, column=2,sticky=E+W) # 左 右 贴 紧 
root .mainloop () 
@ place 几何 布局 管理 器 
place 几何 布局 管理 器 允许 指定 组 件 的 大 小 与 位 置 。 place 几 
何 布 局 管理 器 的 优点 是 可 以 精确 地 控制 组 件 的 位 置 ， 不 足 之 处 
是 改变 窗口 大 小 时 子 组 件 不 能 随 之 灵活 地 改变 大 小 。 
调用 子 组 件 的 方法 place0， 则 该 子 组 件 在 其 父 组 件 中 采用 
place 布局 : 


place (option=value,*…) 


place0 方 法 提供 了 如 表 1-3 所 示 的 若干 参数 选项 , 用 户 可 以 ”图 1-8 ”grid 几何 布局 管理 器 
直接 给 参数 选项 赋值 加 以 修改 。 
表 1-3 ”place() 方 法 提供 的 参数 选项 


选项 取 值 范围 
xy 从 0 开始 的 整数 
relx, rely | 将 组 件 放 到 指定 位 置 的 相对 坐标 0~10 
height, width | 高 度 和 宽度 ， 单 位 为 像素 


anchor 对 齐 方式 ， 对 应 于 东 、 南 、 西 、 北 以 及 4 | n'、's'、'e'、'W'、'nw'、'sw'、'se'、'he'、'center' 
个 角 (默认 值 ) 
注意 : Python 的 坐标 系 是 左上 角 为 原点 位 置 (0.0)， 向 右 是 X 坐标 正方 向 ， 向 下 是 y 坐 
标 正方 向 ， 这 和 数学 中 的 几何 坐标 系 不 同 ， 大 家 一 定 要 注意 这 一 点 。 


加 117 place 几何 布局 管理 器 的 GUI 示例 程序 ， 运 行 效果 如 图 1-9 所 示 。 


from tkinter import * 

root=TKk () 

Foot .title ("登录 ") 
root['width']=200;root['height']=80 


Label (root, text=' 用 户 名 ' , width=6) .place (x=1, y=1) # 绝 对 坐标 (1, 1) 
Entry (root, width=20) .place (x=45, y=1) # 绝 对 坐标 (45, 20) 
Label (root,text=' 密 码 ' ,width=6) .place (x=1, y=20) # 绝 对 坐标 (1, 20) 
Entry (root,width=20, show='*') .place (x=45, y=20) # 绝 对 坐标 (45, 20) 
Button (root, text=' 登录 ',width=8) .place (x=40, y=40) # 绝 对 坐标 (40, 40) 
Button (root, text=' 取 消 ',width=8) .place (x=110, y=40) # 绝 对 坐标 (110, 40) 


root .mainloop () 


图 1-9 place 几何 布局 管理 器 
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1.4.3 Tkinter 组 件 


Tkinter 提供 了 很 多 组 件 ， 例 如 按钮 、 标 签 和 文本 框 等 ， 在 一 个 GUI 应 用 程序 中 使 
这 些 组 件 通常 被 称 为 控件 或 者 部 件 。Tkinter 组 件 如 表 1-4 所 示 。 


表 1-4 Tkinter 组 件 


熔 :在 描 述 
Button 按钮 控件 ， 在 程序 中 显示 按钮 
Canvas 画布 控件 ， 显 示 图 形 元 素 ， 例 如 线条 或 文本 
Checkbutton 多 选 框 控件 ， 用 于 在 程序 中 提供 多 项 选择 框 
Entry 输入 控件 ， 用 于 显示 简单 的 文本 内 容 
Frame 框架 控件 ， 在 屏幕 上 显示 一 个 矩形 区 域 ， 多 用 来 作为 容器 
Label 标签 控件 ， 可 以 显示 全 四 
Listbox | 
Menubutton 
Menu FT 
Message 与 Label 比较 类 似 
Radiobutton 一 个 单 选 的 按钮 状态 
Scale :一 个 数值 刻度 ， 为 输出 限定 范围 的 数字 区 间 
Scrollbar 
Text 
Toplevel 
Spinbox 
PanedWindow 
LabelFrame 
tMessageBox 


通过 组 件 类 的 构造 函数 可 以 创建 其 对 象 实例 。 例 如 : 
from tkinter import * 


root=TKk () 
button1=Button (root，text=" 确 定 ") # 按 钮 组 件 的 构造 函数 


组 件 的 标准 属性 也 就 是 所 有 组 件 ( 控 件 ) 的 共同 属性 , 例如 大 小 、 字 体 和 颜色 等 。 Tkinter 
组 件 常 用 的 标准 属性 如 表 1-5 所 示 。 
表 1-5 Tkinter 组 件 常用 的 标准 属性 


属 性 描 述 


dimension | 控件 大 小 


color | 控件 颜色 

font | 控件 字体 

anchor | 锚 点 (内 容 停靠 位 置 )， 对 应 于 东 、 南 、 西 、 北 以 及 4 个 角 

relief | 控件 样式 

. 位 图 ， 内 置 位 图 包括 error、gray75、gray50、gray25、gray12、info、questhead、 
Snag hourglass、question 和 warning， 自 定义 位 图 为 .xbm 格式 的 文件 
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| 克 要 项 


从 入 门 到 实战 一 一 看 虫 、 游 戏 和 机 器 学 习 


续 表 
属 性 描述 
Cursor | 光标 
text | 显示 文本 内 容 
state 设置 组 件 状 态 为 正常 (normal)、 激 活 (active) 或 禁用 (disabled) 


用 户 可 以 通过 下 列 方式 之 一 设置 组 件 的 属性 。 


button1=Button (root，text=" 确 定 ") “并 按钮 组 件 的 构造 函数 
buttonl. config (text=" 确 定 ") # 组 件 对 象 的 config () 方法 的 命名 参数 
buttonl ["text"]=" 确 定 " # 组 件 对象 的 属性 的 赋值 


@ 标签 组 件 Label 

Label 组 件 用 于 在 窗口 中 显示 文本 或 位 图 。anchor 属性 指定 文本 〈Text) 或 图 像 
(Bitmap/Image) 在 Label 中 的 显示 位 置 ( 如 图 1-10 所 示 ， 其 他 组 件 同 此 )， 对 应 于 东 、 南 、 
西 、 北 以 及 4 个 角 ， 可 用 值 如 下 。 

。e: 垂直 居中 ， 水 平 居 右 。 

。 w: 年 直 居 中 ， 水 平 居 左 。 

。n: 垂直 居 上 ， 水 平 居 中 。 

。 s: 垂直 居 下 ， 水 平 居 中 。 

。 ne: 垂直 居 上 ， 水 平 居 右 。 

。 se: 垂直 居 下 ， 水 平 居 右 。 

。 sw: 垂直 居 下 ， 水 平 居 左 。 

。nw: 垂直 居 上 ， 水 平 居 左 。 
center (默认 值 ): 垂直 居中 ， 水 平 居中 。 
[ 贺 1-18 Label 组 件 示例 ， 运 行 效果 如 图 1-11 所 示 。 


from tkinter import * 


win=Tk (); # 创 建 窗口 对 象 

win.title ("我 的 窗口 ") # 设 置 窗口 标题 

labl=Label (win, text=' 你 好 '，anchor='nw') # 创 建文 字 是 “你 好 ”的 Label 组 件 
labl .pack () # 显 示 Label 组 件 

# 显 示 内 置 的 位 图 

lab2=Label (win, bitmap="'question') ## 创 建 显示 疑问 图 标 Label 组 件 
lab2.pack () # 显 示 Label 组 件 

# 显 示 自 选 的 图 片 


bm=PhotoImage (file=r'J:\2018 书稿 \aa.png') 

lab3=Label (win, image=bm) 

lab3 .bm=bm 

lab3.pack () # 显 示 Label 组 件 
win.mainloop () 


@ 按钮 组 件 Button 
Button 组 件 (控件) 是 一 个 标准 的 Tkinter 部 件 ， 用 于 实现 各 种 按钮 。 按 钮 可 以 包含 文 
本 或 图 像 ， 可 以 通过 command 属性 将 调用 函数 或 方法 关联 到 按钮 上 。 当 Tkinter 的 按钮 被 
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按 下 时 会 自动 调用 该 函数 或 方法 。 


人 @， 


图 1-10 anchor 地 理 方位 图 1-11 Label 组 件 示例 


@ 单行 文本 框 组 件 Entry 和 多 行文 本 框 组 件 Text 

Entry 组 件 主要 用 于 输入 单行 内 容 和 显示 文本 , 可 以 方便 地 向 程序 传递 用 户 参 数 。 这 里 
通过 一 个 转换 摄氏 度 和 华氏 度 的 小 程序 来 演示 该 组 件 的 使 用 。 

1) 创建 和 显示 Entry 对 象 

创建 Entry 对 象 的 基本 方法 如 下 : 

Entry 对 象 =Entry (Windows 窗口 对 象 ) 

显示 Entry 对 象 的 方法 如 下 : 

Entry 对 象 .pack () 


2) 获取 Entry 组 件 的 内 容 

get0) 方 法 用 于 获取 单行 文本 框 内 输入 的 内 容 。 

设置 或 者 获取 Entry 组 件 内 容 也 可 以 使 用 StringVar() 对 象 来 完成 ,把 Entry 的 textvariable 
属性 设置 为 StringVar(0) 变 量 ， 再 通过 StringVar0 变 量 的 get0 和 set0 函 数 读 取 和 输出 相应 文 
本 内 容 。 例 如 : 


Ss=StringVar () # 一 个 StringVar () 对 象 

s.set ("大 家 好 ， 这 是 测试 ") 

entryCd=Entry (root, textvariable=s) #Entry 组 件 显 示 “ 大 家 好 ， 这 是 测试 ” 
print (s.get ()) # 打 印 出 “大 家 好 ， 这 是 测试 ” 


3) Entry 的 常用 属性 

show: 如 果 设 置 为 字符 *， 则 输入 文本 框 内 的 显示 为 *， 用 于 密码 输入 。 
insertbackground: 插入 光标 的 颜色 ， 默 认为 black'。 

selectbackground 和 selectforeground: 选中 文本 的 背景 色 与 前 景色 。 

width: 组 件 的 宽度 〈 所 占 字符 个 数 )。 

他 : 字体 的 前 景 颜色 。 

bg: 背景 颜色 。 

state: 设置 组 件 状态 ， 默 认为 normal， 还 可 设置 为 disabled (禁用 组 件 ) 或 readonly 
(只 读 )。 


Python 还 提供 了 多 行文 本 框 组 件 Text， 用 于 输入 多 行内 容 和 显示 文本 。 其 使 用 方法 类 
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| 号 项 目 案例 开发 
从 入 门 到 实战 一 一 仆 虫 、 游 戏 和 机 器 学 习 
似 Entry， 请 读者 参考 Tkinter 手册 。 
@ 列表 框 组 件 Listbox 
列表 框 组 件 Listbox 用 于 显示 多 个 项 目 ， 并 且 人 允许 用 户 选 择 一 个 或 多 个 项 目 。 
1) 创建 和 显示 Listbox 对 象 
创建 Listbox 对 象 的 基本 方法 如 下 : 
Listbox 对 象 =Listbox (Tkinter Windows 窗口 对 象 ) 
显示 Listbox 对 象 的 方法 如 下 : 
Listbox 对 象 .pack() 
2) 插入 文本 项 
户 可 以 使 用 insert0 方 法 向 列表 框 组 件 中 插入 文本 项 ， 方 法 如 下 : 
Listbox 对 象 .insert (index, item) 
其 中 ，index 是 插入 文本 项 的 位 置 ， 如 果 在 尾部 插入 文本 项 ， 则 可 以 使 用 END; 如 果 在 当 
前 选中 处 插入 文本 项 ， 则 可 以 使 用 ACTIVE。item 是 要 插入 的 文本 项 。 
3) 返回 选中 项 目的 索引 
Listbox 对 象 .curselection() 
返回 当前 选中 项 目的 索引 ， 结 果 为 元 组 。 
注意 : 索引 号 从 0 开始 ，0 表 示 第 1 项 。 
4) 删除 文本 项 
Listbox 对 象 .delete (first,1ast) 
删除 指定 范围 first~last 的 项 目 ， 当 不 指定 last 时 删除 1 个 项 目 。 
5) 获取 项 目 内 容 
Listbox 对 象 .get (first, last) 
返回 指定 范围 first 一 last 的 项 目 ， 当 不 指定 last 时 仅 返回 1 个 项 目 。 
6) 获取 项 目 个 数 
Listbox 对 象 .size () 
7) 获取 Listbox 内 容 
需要 使 用 listvariable 属性 为 Listbox 对 象 指定 一 个 对 应 的 变量 ， 例 如 : 


Im=StringVar () 

listb=Listbox(root, listvariable=m) 
listb.pack() 

root .mainloop () 


指定 后 就 可 以 使 用 m.get0 方 法 获取 Listbox 对 象 中 的 内 容 了 。 
注意 : 如 果 允 许 用 户 选择 多 个 项 目 ， 需 要 将 Listbox 对 象 的 selectmode 属性 设置 为 


i 
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MULTIPLE (表示 多 选 )， 而 设置 为 SINGLE 表示 单 选 。 
贺 1-19 创建 从 一 个 列表 框 选择 内 容 添加 到 另 一 个 列表 框 的 GUI 程序 。 


from tkinter import * # 导 入 Tkinter 库 
root=Tk () # 创 建 窗口 对 象 
def callbuttonl() : 

for i in listb.curselection(): # 遍 历 选 中 项 


listb2.insert (0,1istb.get (i)) ”# 添 加 到 右 侧 列表 框 


def callbutton2(): 


for i in listb2.curselection(): # 遍 历 选 中 项 
listb2.delete (i) # 从 右 侧 列表 框 中 删除 
# 创 建 两 个 列表 
i= python’ "php'. "himnl Son "java"l 
listb=Listbox (root) # 创 建 两 个 列表 框 组 件 
listb2=Listbox (root) 
for item in 1i: # 左 侧 列表 框 组 件 插入 数据 


listb.insert (0,item) 
listb.grid(row=0,column=0,rowspan=2) ”将 列表 框 组 件 放置 到 窗口 对 象 中 
bl=Button (root, text=' 添 加 >>'，command=callbuttonl, width=20) 


创建 Button 组 件 
b2=Button (root, text=' 删 除 <<'，command=callbutton2, width=20) 
# 创 建 Button 组 件 
bl.grid(row=0, column=1, rowspan=2) # 显 示 Button 组 件 
b2.grid(row=1, column=1, rowspan=2) # 显 示 Button 组 件 
listb2.grid(row=0,column=2, rowspan=2) 
root .mainloop() # 进 入 消息 循环 


以 上 代码 的 执行 结果 如 图 1-12 所 示 。 


图 1-12 含有 两 个 列表 框 组 件 的 GUI 程序 


@ 单 选 按钮 组 件 Radiobutton 和 复 选 框 组 件 Checkbutton 

单 选 按 钮 组 件 Radiobutton 和 复 选 框 组 件 Checkbutton 分 别 用 于 实现 选项 的 单 选 和 复 选 
功能 。Radiobutton 用 于 从 同一 组 单 选 按钮 中 选择 一 个 单 选 按钮 (不 能 同时 选择 多 个 )。 
Radiobutton 可 以 显示 文本 ， 也 可 以 显示 图 像 。Checkbutton 用 于 选择 一 项 或 多 项 ， 同 样 
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Checkbutton 可 以 显示 文本 ， 也 可 以 显示 图 像 。 
1) 创建 和 显示 Radiobutton 对 象 

创建 Radiobutton 对 象 的 基本 方法 如 下 : 


Radiobutton 对 象 =Radiobutton (Windows 窗口 对 象 , text=Radiobutton 组 件 显示 的 文本 ) 
显示 Radiobutton 对 象 的 方法 如 下 : 
Radiobutton 对 象 .pack() 


用 户 可 以 使 用 variable 属性 为 Radiobutton 组 件 指定 一 个 对 应 的 变量 。 如 果 将 多 个 
Radiobutton 组 件 绑 定 到 同一 个 变量 ， 则 这 些 Radiobutton 组 件 属 于 一 个 分 组 。 分 组 后 需要 
使 用 value 设置 每 个 Radiobutton 组 件 的 值 ， 以 标识 该 项 目 是 否 被 选中 。 

2) Radiobutton 组 件 的 常用 属性 

。 variable: 单 选 按钮 索引 变量 ， 通 过 变量 的 值 确定 哪个 单 选 按钮 被 选中 。 一 组 单 选 按 

钮 使 用 同一 个 索引 变量 。 

。 value: 单 选 按钮 选中 时 变量 的 值 。 

。 command: 单 选 按钮 选中 时 执行 的 命令 (函数 )。 

3) Radiobutton 组 件 的 方法 

。 deselect(): 取消 选择 。 

。 select():; 选择 。 

。 invoke(): 调用 单 选 按钮 command 指定 的 回调 函数 。 

4) 创建 和 显示 Checkbutton 对 象 

创建 Checkbutton 对 象 的 基本 方法 如 下 : 

Checkbutton 对 象 =<Checkbutton (Tkinter Windows 窗口 对 象 ,text=Checkbutton 组 件 显 
示 的 文本 ， command= 单 击 Checkbutton 按钮 所 调用 的 回调 函数 ) 


显示 Checkbutton 对 象 的 方法 如 下 : 
Checkbutton 对 象 .pack() 


5) Checkbutton 组 件 的 常用 属性 
。 variable: 复 选 框 索 引 变量 ， 通 过 变量 的 值 确定 哪些 复 选 框 被 选中 。 每 个 复 选 框 使 用 
不 同 的 变量 ， 使 复 选 框 之 间 相 互 独立 。 

。 onvalue: 复 选 框 选中 (有效) 时 变量 的 值 。 

。 offvalue: 复 选 框 未 选中 无效) 时 变量 的 值 。 

。 command: 复 选 框 选中 时 执行 的 命令 (函数 )。 

6) 获取 Checkbutton 组 件 的 状态 

为 了 获取 Checkbutton 组 件 是 否 被 选中 ， 需 要 使 用 variable 属性 为 Checkbutton 组 件 指 
定 一 个 对 应 变量 ， 例 如 : 

c=tkinter.IntVvar() 


c.set (2) 
check=tkinter.Checkbutton (root, text=' 嘉 欢 ', variable=c, onvalue=1, 
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offvalue=2) ##1 为 选中 ，2 为 没 选中 

check.pack() 

指定 变量 后 ， 可 以 使 用 c.get0 获 取 复 选 框 的 状态 值 ， 也 可 以 使 用 c.setO 设 置 复 选 杠 
的 状态 。 例 如 设置 check 对 象 为 没 选中 状态 ， 代 码 如 下 : 

c.set (2) #1 为 选中 ，2 为 没 选中 ， 设 置 为 2 就 表示 没 选中 状态 

获取 单 选 按钮 (Radiobutton ) 状态 的 方法 同上 。 

[ 贺 1-20 创建 使 用 单 选 按钮 (Radiobutton) 组 件 选择 国家 的 程序 。 


import tkinter 

root=tkinter.Tk() 

r=tkinter.stringVar () ## 创 建 StringVar 对 象 

r.set('1') # 设 置 初始 值 为 “1”， 初 始 选 中 “中 国 ” 
radio=tkinter.Radiobutton (root, variable=r, value="'1', text=' 中 国 ') 
radio.pack() 
radio=tkinter.Radiobutton (root, variable=r, value="'2' ,text=' 美 国 ') 


radio.pack() 

radio=tkinter.Radiobutton (root, variable=r, value='3',text=' 日 本 ') 
radio.pack() 

radio=tkinter.Radiobutton (root, variable=r, value='4',text="' 加 拿 大 ' ) 
radio.pack() 

radio=tkinter.Radiobutton (root, variable=r, value='5', text=' 韩 国 ') 
radio.pack() 

root .mainloop () 


print (r.get ()) # 获 取 被 选中 单 选 按 钮 变量 值 


以 上 代码 的 执行 结果 如 图 1-13 所 示 。 选 中 日 本 后 打印 出 3。 

@ 菜单 组 件 Menu 

图 形 用 户 界 面 应 用 程序 通常 提供 菜单 , 菜单 包含 各 种 按照 主 
题 分 组 的 基本 命令 。 通常 ， 图 形 用 户 界 面 应 用 程序 包括 两 种 类 型 
的 菜单 。 

(1) 主 菜单 : 提供 窗 体 的 菜单 系统 。 通过 单 击 可 下 拉 出 子 菜 
单 ， 选 择 命令 可 执行 相关 的 操作 。 常 用 的 主 菜单 一 般 包括 文件 、 
编辑 、 视 图 、 帮 助 等 。 图 1-13 单 选 按 钮 示例 程序 

(2) 上 下 文 菜单 (也 称 为 快捷 菜单 )， 通过 右 击 某 对 象 而 弹出 的 菜单 ， 一 般 为 与 该 对 
象 相关 的 常用 菜单 命令 ， 例 如 剪 切 、 复 制 、 粘 贴 等 。 

创建 Menu 对 象 的 基本 方法 如 下 : 

Menu 对 象 =Menu (Windows 窗口 对 象 ) 

将 Menu 对 象 显示 在 窗口 中 的 方法 如 下 : 


Windows 窗口 对 象 [ "menu']=Menu 对 象 
Windows 窗口 对 象 .mainloop () 
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[ 贺 1-21 使 用 Menu 组 件 的 简单 例子 ， 运 行 效果 如 图 1-14 所 示 。 


from tkinter import * 

root=Tk () 

def hello(): # 菜 单项 事件 函数 ， 每 个 菜单 项 可 以 单独 写 
print ("你 单 击 主 菜单 ") 


m=Menu (root) 


for item in [' 文 件 ', ' 编 辑 ', ' 视 图 '] : # 添 加 菜单 项 
m.add command (label=item, command=hello) 
root['menu']=m # 附 加 主 菜单 到 窗口 


root .mainloop() 


@ 消息 窗口 组 件 Messagebox 

消息 窗口 组 件 Messagebox 用 于 弹出 提示 框 向 上 
户 进行 告警 ， 或 让 用 户 选择 下 一 步 如 何 操作 。 消 息 
框 包括 很 多 类 型 ， 常 用 的 有 info、waring、error、 
yesno、okcancel 等 ， 包 含 不 同 的 图 标 、 按 钮 以 及 弹 
出 提示 音 。 

辆 1-22 演示 各 消息 框 的 程序 ， 运 行 效果 如 图 二 14 使 用 Meno 组 作 的 洒 半 运 行 效果 
图 1-15 所 示 。 


import tkinter as tk 
from tkinter import messagebox as msgbox 
def btnl clicked() : 
msgbox.showinfo("Info", "Showinfo test.") 
def btn2 clicked() : 
msgbox .showwarning ("Warning", "Showwarning test.") 
def btn3 clicked() : 
msgbox.showerror ("Error", "Showerror test.") 
def btn4 clicked() : 
msgbox.askquestion ("Question", "Askquestion test.") 
def btn5 clicked() : 
msgbox.askokcancel ("OkCancel", "Askokcancel test.") 
def btn6 clicked() : 
msgbox .askyesno ("YesNo", "Rskyesno test.") 
def btn7 clicked() : 
msgbox.askretrycancel ("Retry", "Askretrycancel test.") 
root=tk.Tk() 
root.title ("MsgBox Test") 
btnl=tk.Button (root, text="showinfo", command=btnl] clicked) 
btnl .pack (fill=tk .Xx) 
btn2=tk.Button (root, text="showwarning", command=btn2 clicked) 
btn2 .pack (fill=tk .Xx) 
btn3=tk.Button (root, text="showerror", command=btn3 clicked) 
btn3.pack (fill=tk .Xx) 
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btn4=tk.Button (root, text="askquestion", command=btn4 clicked) 
btn4.pack (fill=tk .xX) 

btn5=tk.Button (root, text="askokcancel", command=btn5 clicked) 
btn5.pack (fill=tk.xX) 

btn6=tk-Button (root, text="askyesno", command=btn6 clicked) 
btn6.pack (fill=tk .Xx) 

btn7=tk.Button (root, text="askretrycancel", command=btn7 clicked) 
btn7.pack (fill=tk .xX) 

root .mainloop() 


askquestion 


askokcancel 


askretrycancel 


图 1-15 消息 窗口 的 运行 效果 


@ 框架 组 件 Frame 
Frame 组 件 是 框架 组 件 ， 在 分 组 组 织 其 他 组 件 的 过 程 中 是 非常 重要 的 ， 负 责 安排 其 他 


组 件 的 位 置 。Frame 组 件 在 屏幕 上 显示 为 一 个 矩形 区 域 ， 作 为 显示 其 他 组 件 的 容器 。 


可 


1) 创建 和 显示 Frame 对 象 
创建 Frame 对 象 的 基本 方法 如 下 : 


Frame 对 象 =Frame (窗口 对 象 ，height= 高 度 , width= 宽 度 ,bg= 背 景色 ，.. .) 
例如 ， 创 建 第 1 个 Frame 组 件 ， 其 高 为 100， 宽 为 400， 背 景色 为 绿色 。 
fl1=Frame (root, height=100,width=400,bg='green') 

显示 Frame 对 象 的 方法 如 下 : 

Frame 对 象 .pack() 


2) 向 Frame 组 件 中 添加 组 件 
在 创建 组 件 时 指定 其 容器 为 Frame 组 件 即 可 ， 例 如 : 


Label (Frame 对 象 ,text='Hello') .pack() 间 向 Frame 组 件 中 添加 一 个 Label 组 件 


3) LabelFrame 组 件 
LabelFrame 组 件 是 有 标题 的 Frame 组 件 , 可 以 使 用 text 属性 设置 LabelFrame 组 件 的 标 
方法 如 下 : 


LabelFrame (窗口 对 象 ，height= 高 度 , width= 宽 度 ,text= 标 题 ) .pack () 
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[ 贺 1-23 使 用 两 个 Frame 组 件 和 一 个 LabelFrame 组 件 的 例子 。 


from tkinter import * 


root=TKk () # 创 建 窗口 对 象 

root .title ("使 用 Frame 组 件 的 例子 ") # 设 置 窗口 标题 
£1=Frame (root) # 创 建 第 1 个 Frame 组 件 
£1.pack() 

£2=Frame (root) # 创 建 第 2 个 Frame 组 件 
£2.pack() 


f3=LabelFrame (root, text=' 第 3 个 Frame wp 

# 第 3 个 LabelFrame 组 件 ， 放 置 在 窗口 底部 
f3.pack(side=BOTTOM) 
redbutton=Button (fl, text="Red", fg="red") 
redbutton.pack (side=LEFT) 
brownbutton=Button (fl, text="Brown", fg="brown") 
brownbutton.pack (side=LEFT) 
bluebutton=Button (fl, text="Blue", fg="blue") 
bluebutton.pack (side=LEFT) 
blackbutton=Button (f2, text="Black", fg="black") 
blackbutton.pack() 
greenbutton=Button (人 3， text="Green", fg="Green") 
greenbutton.pack() 
Foot .mainloop () 


以 上 代码 通过 Frame 框架 把 5 个 按钮 分 成 3 个 区 域 ， 第 1 个 区 域 3 个 按钮 ， 第 2 个 


区 


域 1 个 按钮 ， 第 3 个 区 域 1 个 按钮 ， 运 行 效果 如 图 1-16 所 示 。 


(a 使 用 Frame 组 件 的 例子 2 


| Red | Brown | 
Black 
第 3 个 Frame 


reen| 


图 1-16 ”Frame 框架 的 运行 效果 


4) 刷新 Frame 
用 Python 做 GUI 图 形 界 面 ， 可 以 使 用 after0 方 法 每 隔 几 秒 刷 新 GUI 图 形 界 面 。 例 如 


下 面 的 代码 实现 计数 器 功能 ， 并 且 文 字 背 景色 不 断 改变 。 


from tkinter import * 

colors=('red', '‘'orange', 'yellow', 'green', 'blue', "purple') 
root=Tk () 

f=Frame (root, height=200, width=200) 

f.color=0 

f['bg']=colors[f.color] # 设 置 框架 背景 色 

labl=Label (f, text="'0"') 
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labl .pack () 
def foof) : 
f.color=(f.color+l1)$(len(colors)) 
labl['bg']=colors[f.color] 
labl['text']=str (int (labl['text'])+1) 
f.after(500，fo0)  # 隔 500 ms 执行 foo () 函数 刷新 屏幕 
f.pack() 
f.after(500, foo) 
root .mainloop () 
例如 开发 移动 电子 广告 效果 就 可 以 使 用 after0 方 法 实现 不 断 移动 lab1。 
from tkinter import * 
root=TKk () 
f=Frame (root, height=200, width=200) 
labl=Label (f£, text=' 欢 迎 参观 中 原 工 学 院 ') 
X=0 
def foo() : 
global x 
X=X+10 
if x>200: 
x=0 
labl .place (x=x, y=0) 
f.after(500，foo)  # 隔 500 ms 执行 foo () 函数 刷新 屏幕 


f.pack() 
f.after(500, foo) 
Foot .mainloop () 


运行 程序 可 见 “ 欢 迎 参观 中 原 工 学 院 ” 不 停 地 从 左 向 右 移动 ， 出 了 窗口 右 侧 以 后 重新 


从 左 侧 出 现 。 利 用 此 技巧 可 以 开发 类 似 的 贪 吃 蛇 游戏 ， 借 助 after0 方 法 实现 不 断 改 变 蛇 的 
位 置 ， 从 而 达到 蛇 移 动 的 效果 。 


1.4.4 Tkinter 字体 


通过 组 件 的 font 属性 可 以 设置 其 显示 文本 的 字体 ， 注 意 在 设置 组 件 字体 前 首先 要 能 表 


示 一 个 字体 。 


@ 通过 元 组 表示 字体 
通过 3 个 元 素 的 元 组 可 以 表示 字体 : 
(font family,size,modifiers) 


作为 一 个 元 组 的 第 1 个 元 素 的 font family 是 字体 名 ; size 为 字体 大 小 ， 单 位 为 point; 


modifiers 为 包含 粗 体 、 和 斜体 、 下 夯 线 的 样式 修饰 符 。 


例如 : 


("Times New Roman ", "16") #16 点 阵 的 Times 字体 
("Times New Roman ",， "24"， "bold italic")#24 点 阵 的 Times 字体 ， 且 为 粗 体 、 斜 体 
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贺 1-24 通过 元 组 表示 字体 设置 标签 的 字体 ， 运 行 效果 如 图 1-17 所 示 。 


from tkinter import * 

root=Tk () 

# 创 建 Label 

for ft in('Arial', ('Courier New',19,'"'italic'), ('Comic Sans MS',),'Fixdsys', 

('MS Sans Serif',), ('MS Serif',),'Symbol','System', ('Times New Roman',), 'Verdana'): 
Label (root, text="'hello sticky',font=ft) .grid() 

Foot .mainloop() 


这 个 程序 在 Windows 上 测试 字体 显示 , 注意 字体 中 包含 
有 空格 的 字体 名 称 必须 指定 为 元 组 类 型 。 helo sticky 
人 @ 通过 Font 对 象 表示 字体 I 
使 用 tkFont.Font 来 创建 字体 ， 格 式 如 下 : | hello sticky 
hello sticky 
ft=tkFont .Font (family=' 字 体 名 ', size, weight, | 说 ee 
slant, underline, overstrike) | me)7o onyry 
hello sticky 
其 中 ，size 为 字体 大 小 :weight='bold' 或 mormal'，'bold' 为 粗 | cto stickcy 
体 ，slant='italic' 或 normal'，'italic 为 斜体 ，underline=1 或 0， helo Stay 
1 为 下 画 线 ，overstrike=1 或 0，1 为 删除 线 。 图 1-17 缩放 图 形 对 象 运行 效果 
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ft=Font (family='Helvetica',size=36,weight='bold') 
加 1-25 通过 Font 对 象 设置 标签 字体 ， 运 行 效果 如 图 1-18 所 示 。 
# 通 过 Font 对 象 来 创建 字体 


from tkinter import * 

import tkinter.font # 引 入 字体 模块 
root=TKk () 

# 指 定 字体 名 称 、 大 小 、 样 式 

ft=tkinter.font.Font (family='Fixdsys',size=20,weight='bold') 

Label (root, text='hello sticky',font=ft) .grid() # 创 建 一 个 Label 

Foot .mainloop () 


通过 tkFont. families() 函 数 可 以 返回 所 有 可 用 的 字体 。 


from tkinter import * PR ws 

import tkinter.font # 引 入 字体 模块 hello sticky| 
Foot=TK() 

print (tkinter.font.families()) 图 1-18 通过 Font 对 象 设置 标签 字体 
输出 结果 : 


('"Forte'，"Felix Titling', 'Eras Medium ITC', 'Eras Light ITC'，"Eras Demi 
ITC', 'Eras Bold ITC', 'Engravers MT', ‘Elephant', 'Edwardian Script ITC', 
"Cur1z MT', 'Copperplate Gothic Light', 'Copperplate Gothic Bold', 'Century 
Schoolbook', 'Castellar', 'Calisto MT', 'Bookman Old Style', 'Bodoni MT 
Condensed', 'Bodoni MT Black', 'Bodoni MT', 'Blackadder ITC', 'Arial Rounded 
MT Bold', "Agency FB', "Bookshelf Symbol 7', 'MS Reference Sans Serif', 'MS 
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Reference Specialty'，'"Berlin Sans FB Demi', 'Tw Cen MT Condensed Extra Bold', 
"Calibri Light'，'Bitstream Vera Sans Mono'， ' 方 正 兰 亭 超 细 黑 简体 "'，' 方正 兰亭 
超 细 黑 简体 "， 'Buxton Sketch'，" Segoe Marker', 'SketchFlow Print') 


1.4.5 “Python 事件 处 理 


所 谓 事件 (Event)， 就 是 程序 上 发 生 的 事 。 例 如 用 户 敲 击 键盘 上 的 某 i 
一 个 键 或 是 单 击 、 移 动 鼠 标 。 对 于 这 些 事件 ， 程 序 需 要 做 出 反应 。Tkinter 和 
提供 的 组 件 通常 都 有 自己 可 以 识别 的 事件 。 例 如 当 按 钮 被 单 击 时 执行 特定 
操作 ， 或 者 当 一 个 输入 栏 成 为 焦点 ， 而 用 户 又 敲 击 了 键盘 上 的 某 些 键 时 ， 用 户 所 输入 的 内 
容 就 会 显示 在 输入 栏 内 。 
程序 可 以 使 用 事件 处 理 函数 来 指定 当 触 发 某 个 事件 时 所 做 的 反应 《〈 操 作 
@ 事件 类 型 
事件 类 型 的 通用 格式 如 下 : 


<[modifier-]…type[-detail]> 


人 


~ 


事件 类 型 必须 放置 于 尖 括 号 人 > 内 。type 描述 了 类 型 , 例如 键盘 按键 、 鼠 标 单 击 .modifier 
用 于 组 合 键 定义 ， 例 如 Control、Alt。detail 用 于 明确 定义 是 哪 一 个 键 或 按钮 的 事件 ， 例 如 
1 表示 鼠标 左 键 、2 表示 鼠标 中 键 、3 表示 鼠标 右键 。 


举例 如 下 : 
<Button-1> # 按 下 鼠标 左 键 
<KeyPress-A> # 按 下 键盘 上 的 A 键 
<Control-Shift-KeyPress-A> # 同 时 按 下 了 control、Shift、A 3 个 键 
在 Python 中 ， 键 盘 事 件 见 表 1-6， 鼠 标 事件 见 表 1-7， 窗 体 事件 见 表 1-8。 
表 1-6 键盘 事件 
名 称 描 述 
KeyPress 按 下 键盘 上 的 某 键 时 触发 ， 可 以 在 detail 部 分 指定 是 哪个 键 
KeyRelease 释放 键盘 上 的 某 键 时 触发 ， 可 以 在 detail 部 分 指定 是 哪个 键 
表 1-7 鼠标 事件 
名 称 描 述 
ButtonPress 或 Button 按 下 鼠标 某 键 ， 可 以 在 detail 部 分 指定 是 哪个 键 
ButtonRelease 释放 鼠标 某 键 ， 可 以 在 detail 部 分 指定 是 哪个 键 
Motion 点 中 组 件 的 同时 拖 电 组 件 移动 时 触发 
Enter 当 鼠 标 指针 移 进 某 组 件 时 触发 
Leave 当 鼠 标 指针 移出 某 组 件 时 触发 
MouseWheel 当 鼠 标 滚轮 滚动 时 触发 
表 1-8 窗 体 事件 
名 称 描 述 
Visibility | 当 组 件 变 为 可 视 状 态 时 触发 
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名 称 描 述 
Unmap 当 组 件 由 显示 状态 变 为 隐藏 状态 时 触发 
Map 当 组 件 由 隐藏 状态 变 为 显示 状态 时 触发 
Expose 当 组 件 从 原本 被 其 他 组 件 遮盖 的 状态 中 暴露 出 来 时 触发 
FocusIn 当 组 件 获 得 焦点 时 触发 
FocusOut 当 组 件 失去 焦点 时 触发 
Configure 当 改 变 组 件 大 小 时 触发 ， 例 如 拖 电 窗 体 边缘 
Property 当 窗 体 的 属性 被 删除 或 改变 时 触发 ， 属 于 Tk 的 核心 事件 
Destroy 当 组 件 被 销毁 时 触发 
efit 与 组 件 选项 中 的 state 项 有 关 ， 表 示 组 件 由 不 可 用 转 为 可 用 ， 例 如 按钮 由 
disabled (灰色 ) 转 为 enabled 
与 组 件 选项 中 的 state 项 有 关 ， 表 示 组 件 由 可 用 转 为 不 可 用 ， 例 如 按钮 由 
Deactivate 


enabled 转 为 disabled (灰色 ) 


modifier 组 合 键 定义 中 常用 的 修饰 符 见 表 1-9。 


修 饰 符 
Alt 
Any 
Control 
Double 
Lock 
Shift 
Triple 


表 1-9 组 合 键 定义 中 常用 的 修饰 符 
描 述 
Alt 键 按 下 
任何 按键 按 下 ， 例 如 <Any-KeyPress> 
Control 键 按 下 
两 个 事件 在 短 时 间 内 发 生 ， 例 如 双击 鼠标 左 键 <Double-Button-1> 
Caps Lock 键 按 下 
Shift 键 按 下 
类 似 于 Double，3 个 事件 短 时 间 内 发 生 


可 以 用 短 格式 表示 事件 ， 例 如 <1> 等 同 于 <Button-1>、<x> 等 同 于 <KeyPress-x>。 
对 于 大 多 数 的 单字 符 按键 ， 用 户 还 可 以 忽略 “<>” 符 号 ， 但 是 空格 键 和 尖 括 号 键 不 能 
这 样 做 正确 的 表示 分 别 为 <space>、<less>)。 


@ 事件 绑 定 


程序 建立 一 个 处 理 某 一 事件 的 事件 处 理 函 数 称 为 绑 定 。 


1) 创建 组 件 对 象 时 指定 


def callback() : 


在 创建 组 件 对 象 实例 时 ， 可 以 通过 其 命名 参数 command 指定 事件 处 理 函 数 。 例 如 : 


# 事 件 处 理 函 数 


showinfo ("Python command", "人生 苦 短 ， 我 用 Python") 
Bul=Button (root，text=" 设 置 command 事件 调用 命令 ", command=callback) 


Bul.pack() 


2) 实例 绑 定 


调用 组 件 对 象 实例 方 
方式 。 


法 bind0 可 以 为 指定 组 件 实例 绑 定 事件 ， 这 是 最 常用 的 事件 绑 定 


组 件 对 象 实例 名 .binad ("< 事 件 类 型 >"， 事 件 处 理 函数 ) 


例如 ， 假 如 声明 了 一 
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个 名 为 canvas 的 Canvas 组 件 对 象 ， 想 在 canvas 上 按 下 鼠标 左 键 


第 1 章 Python 基础 知识 01 


时 画 一 条 线 ， 可 以 这 样 实现 : 
canvas.bind("<Button-1>", drawline) 


其 中 ，bind 函数 的 第 1 个 参数 是 事件 描述 符 ， 指 定 无 论 什 么 时 候 在 canvas 上 ， 当 按 下 鼠标 
左 键 时 就 调用 事件 处 理 函 数 drawline 进行 画 线 的 任务 。 特 别 需要 说 明 的 是 ，drawline 后 面 
的 圆 括 号 是 省 略 的 ，Tkinter 会 将 此 函数 填 入 相关 参数 后 调用 运行 ， 在 这 里 只 是 声明 
而 已 。 

3) 标识 绑 定 

在 Canvas 画布 中 绘制 各 种 图 形 , 将 图 形 与 事件 绑 定 可 以 使 用 标识 绑 定 函 数 tag_bind()。 
预先 为 图 形 定 义 标识 tag 后 ， 通 过 标识 tag 来 绑 定 事件 。 例 如 : 

cv.tag bind('rl','<Button-1>',printRect) 

[ 圆 1-26 标识 绑 定 的 例子 。 


from tkinter import * 
root=Tk () 
def printRect (event): 

print ('rectangle 左 键 事件 ') 
def PrintRect2 (event): 

print ('rectangle 右键 事件 ') 
def printLine (event): 

print ('Line 事件 ') 


cv=Canvas (root, bg='white') # 创 建 一 个 canvas， 设 置 其 背景 色 为 白色 
rtl=cv.create rectangle( 

TO 人 OO 

width=8, tags="'r1') 
cv.tag bind('rl','<Button-1>',printRect) # 绑 定 item 与 鼠标 左 键 事件 
cv.tag bind('rl','<Button-3>',printRect2) “ # 绑 定 itenm 与 鼠标 右键 事件 
# 创 建 一 个 1ine， 并 将 其 tags 设置 为 'r2' 
cv.create line(180,70,280,70,width=10,tags="'r2') 
cv.tag bind('r2','<Button-1>',printLine) # 绑 定 item 与 鼠标 左 键 事件 
cv.pack() 
root .mainloop () 


在 这 个 示例 中 , 单 击 到 甜 形 的 边框 时 才 会 触发 事件 , 矩形 既 响应 鼠标 左 键 又 响应 右键 。 
当 用 鼠标 左 键 单 击 矩 形 边框 时 出 现 “rectangle 左 键 事件 ”信息 ， 用 鼠标 右键 单 击 矩 形 边框 
时 出 现 “rectangle 右键 事件 ”信息 ， 用 鼠标 左 键 单 击 直线 时 出 现 “Line 事件 ”信息 。 
@ 事件 处 理 函 数 
1) 定义 事件 处 理 函 数 
事件 处 理 函 数 往往 带 有 一 个 event 参数 , 在 触发 事件 调用 事件 处 理 函 数 时 将 传递 Event 
对 象 实例 。 

def callback (event) : # 事 件 处 理 函 数 
showinfo ("Python command", "人 生 苦 短 ， 我 用 Python") 
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2) Event 对 象 的 参数 


Event 对 象 可 以 获取 各 种 相关 参数 ， 主 要 参数 如 表 1-10 所 示 。 
表 1-10 ”Event 对 象 的 主要 参数 
参数 说 明 
XY 鼠标 相对 于 组 件 对 象 左 上 角 的 坐标 


.xX IOOt,.y_root 


鼠标 相对 于 屏幕 左上 角 的 坐标 
字符 串 命 名 按键 ， 例 如 Escape、F1 一 F12、Scroll Lock、Pause、Insert、Delete、 


.keysym Home、Prior (这 个 是 page up) 、Next (这 个 是 page down) 、End、Up、Right、 
Left、 Down、 Shift L、 Shift R、Control L、 Control R、 Alt L、 Alt R、 Win L 

.keysym num 数字 代码 命名 按键 

el 键 码 ， 但 是 它 不 能 反映 事件 前 级 Alt、Control、Shift、Lock， 并 且 它 不 区 分 大 小 
写 按键 ， 即 输入 a 和 A 是 相同 的 键 码 

-time 时 间 

pe 事件 关 型 

.Widget 触发 事件 的 对 应 组 件 

-char 字符 


Event 对 象 按键 的 详细 信息 如 表 1-11 所 示 。 


表 1-11 Event 对 象 按键 的 详细 信息 


.keysym 说 明 
Alt 工 左手 边 的 Alt 键 
Alt R 右手 边 的 Alt 键 
BackSpace BackSpace 键 
Cancel Pause Break 键 
En | 
Print | 1 | 567 | 打印 屏幕 刍 
[ 圆 1-27 触发 keyPress 键盘 事件 的 例子 ， 运 行 效果 如 图 1-19 所 示 。 
from tkinter import * # 导 入 Tkinter 库 
def printkey (event): # 定 义 的 函数 监听 键盘 事件 

print(' 你 按 下 了 : '+event .char) 
root=Tk () # 实 例 化 tk 
entry=Entry (root) # 实 例 化 一 个 单行 输入 框 


# 给 输入 框 绑 定 按键 监听 事件 <KeyPress> 为 监听 任何 按键 
#<KeyPress-x> 为 监听 某 键 x， 例 如 <KeyPress-A> 为 监听 A、<KeyPress-Return> 为 监听 回 车 
entry.bind('<KeyPress>', printkey) 


entry.pack() 


root .mainloop () # 显 示 窗 体 
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图 1-19 keyPress 键盘 事件 运行 效果 


Nompn 
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贺 1-28 获取 鼠标 单 击 标签 时 坐标 的 鼠标 事件 例子 ， 运 行 效果 如 图 1-20 所 示 。 


from tkinter import * # 导 入 Tkinter 库 
def leftclick(event) : # 定 义 的 函数 监听 鼠标 事件 
print ("x 轴 坐 标 :"，event .x) 
Print ("y 轴 坐 标 :"，event.y) 
print ("相对 于 屏幕 左上 角 x 轴 坐 标 :"，event .x root) 
print ("相对 于 屏幕 左上 角 y 轴 坐 标 :"，event .y root) 


root=Tk () # 实 例 化 tk 
lab=Label (root, text="hello") # 实 例 化 一 个 Label 
lab.pack () 显示 Label 组 件 
# 给 Label 绑 定 鼠 标 监听 事件 
lab.bind("<Button-1>", leftClick) 
root .mainloop () # 显 示 窗 体 
Bi 91 
下 ea 11 
对 于 屏幕 左上 角 x 轴 坐标 : 107 
人 
E 二 
坐标 : 6 
坐标 : 104 
和 


图 1-20 鼠标 事件 运行 效果 


1.4.6 ”图 形 界面 设计 应 用 案例 一 一 开发 猿 数 字 游 戏 


【案例 】 使 用 Tkinter 开发 猜 数字 游戏 ， 运 行 效果 如 图 1-21 所 示 。 
在 该 游戏 中 ， 计 算 机 随机 生成 1024 以 内 的 数字 ， 玩 家 去 猜 ， 猜 的 数字 过 大 、 过 小 都 会 给 


出 提示 ， 程 序 要 统计 玩家 猜 的 次 数 。 


import tkinter as tk 
import random 


number=random.randint (0,1024) # 玩 家 要 猜 的 数字 

running=True 

num=0 # 猜 的 次 数 

nmaxn=1024 # 提 示 猜 测 范围 的 最 大 数 

nminn=0 # 提 示 猜 测 范围 的 最 小 数 

def eBtnclose (event) : #“ 关 闭 ” 按 钮 事件 函数 
root .destroy() 

def eBtnGuess (event): #“ 猜 ”按钮 事件 函数 
global nmaxn # 全 局 变量 


global nminn 
global num 


global running 
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if running: 
val a=int (entry a.get()) # 获 取 猜 的 数字 并 转换 成 数字 
if val a==number: 
labelqval (" 恭 喜 答 对 了 ! ") 
num+=1 


running=False 


numGuess () # 显 示 猜 的 次 数 
elif val a<number: # 猜 小 了 
if val a>nminn: 
nminn=val a # 修 改 提示 猜测 范围 的 最 小 数 
num+=1 


e156: 
if 


Glses 


labelqval ("小 了 哦 ,请 输入 "+str (nminn)+" 到 "+str (nmaxn) +" 之 间 任 意 
整数 : ") 


Val a<nmaxn: 

nmaxn=val a # 修 改 提示 猜测 范围 的 最 大 数 

num+=1 

labelqval ("大 了 哦 ,请 输入 "+str (nminn)+" 到 "+str (nmaxn)+" 之 间 任 意 
整数 : ") 


labelqval(' 你 已 经 答对 啦 ...') 


# 显 示 猜 的 次 数 


def numGuess () : 


if num== 


labelqval (' 一 次 答对 ! ') 
elif num<10 : 
labelqval('== 十 次 以 内 就 答对 了 牛 。。。 尝 试 次 数 : '+str (num) ) 


SESeE: 


labelqval (' 好 吧 ， 您 都 试 了 超过 10 次 了 。。。。 尝 试 次 数 : '+str (num) ) 


def labelqval (vText) : 
label val q.config(label val q,text=vText) # 修 改 提示 标签 文字 


root=tk.Tk(className=" 猜 数字 游戏 ") 

Foot .geometry ("400X90+200+200") 

label val q=tk.Label (root,width="80") 提示 标签 
label val q.pack(side="top") 


entry a=tk.Entry (root,width="40") # 单 行 输 入 文本 框 
btnGuess=tk.Button (root,text=" 猜 ") #“ 猜 ”按钮 
entry a.pack (side="]left") 

entry a.bind('<Return>',eBtnGuess) # 绑 定 事件 
btnGuess.bind('<Button-1>',eBtnGuess) #“ 猜 ”按钮 


btnGuess.pack (side="]left") 
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btnclose=tk.Button (root, text=" 关 闭 ") 非 “关闭 ”按钮 
btnClose.bind('<Button-1>',eBtnClose) 

btnClose.pack (side="]left") 

labelqval ("请 输入 0 到 1024 之 间 任 意 整数 : ") 

entry a.focus set () 

print (number) 

Foot .mainloop () 


= = 十 次 以 内 就 答对 了 牛 。。。 将 试 次 数 : 3 


小 了 距 请 给 入 100 到 567 之 间 任 齐整 数 : 


到 a 


EE 


图 1-21 猜 数 字 游 戏 运行 效果 


1.5 ”Python 文件 的 使 用 


在 程序 运行 时 ， 数 据 保存 在 内 存 的 变量 里 。 内 存 中 的 数据 在 程序 结束 ” 国 
或 关机 后 就 会 消失 。 如 果 想 要 在 下 次 开机 运行 程序 时 还 使 用 同样 的 数据 ， E 
就 需要 把 数据 存储 在 不 易 失 的 存储 介质 中 ， 例 如 硬盘 、 光 盘 或 U 盘 里 ,不 
易 失 存储 介质 上 的 数据 保存 在 以 存储 路 径 命 名 的 文件 中 。 通 过 读 / 写 文件 ， TD 
程序 就 可 以 在 运行 时 保存 数据 。 本 节 学 习 使 用 Python 在 磁盘 上 创建 、 读 / ”视频 讲解 
写 以 及 关闭 文件 。 

使 用 文件 跟 人 们 在 平时 生活 中 使 用 记事 本 很 相似 。 在 使 用 记事 本 时 需要 先 打 开本 子 ， 
使 用 之 后 要 合 上 它 。 在 打开 记事 本 后 ， 既 可 以 读 取信 息 ， 也 可 以 向 本 子 里 写 。 不 管 是 哪 种 
情况 ， 都 需要 知道 在 哪里 进行 读 / 写 。 在 记事 本 中 既 可 以 一 页 一 页 从 头 到 尾 地 读 ， 也 可 以 直 
接 跳 转 到 需要 的 地 方 。 

在 Python 中 对 文件 的 操作 通常 按照 以 下 3 个 步骤 进行 : 

(1) 使 用 openO 函 数 打开 (或 建立 ) 文件 ， 返 回 一 个 file 对 象 。 

(2) 使 用 file 对 象 的 读 / 写 方法 对 文件 进行 读 / 写 操作 。 其 中 ， 将 数据 从 
外 存 传输 到 内 存 的 过 程 称 为 读 操作 ， 将 数据 从 内 存 传输 到 外 存 的 过 程 称 为 ” 国 8 
写 操作 。 

(3) 使 用 file 对 象 的 close() 方 法 关闭 文件 。 


1.5.1 打开 /建立 文件 img 


在 Python 中 要 访问 文件 , 必须 打开 Python Shell 与 磁盘 上 文件 之 间 的 连接 。 在 使 用 open0 
函数 打开 或 建立 文件 时 会 建立 文件 和 使 用 它 的 程序 之 间 的 连接 ， 并 返回 代表 连接 的 文件 对 
象 ， 通 过 文件 对 象 就 可 以 在 文件 所 在 的 磁盘 和 程序 之 间 传 递 文件 内 容 ， 执 行文 件 上 的 所 有 
后 续 操作 。 文 件 对 象 有 时 也 称 为 文件 描述 符 或 文件 流 。 
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在 建立 了 Python 程序 和 文件 之 间 的 连接 后 就 创建 了 “ 流 ” 数 据 ， 如 图 1-22 所 示 。 通 
常 ， 程 序 使 用 输入 流 读 出 数据 ， 使 用 输出 流 写 入 数据 ， 就 好 像 数据 流入 到 程序 并 从 程序 中 
流出 。 在 打开 文件 后 才能 读 或 写 〈 或 读 并 且 写 ) 文件 内 容 。 


输入 设备 输出 设备 
一 输入 流 输出 流 
执行 程序 
标准 输入 /输出 
输入 流 输出 流 
输入 文件 执行 程序 输出 文件 
文件 输入 /输出 


图 1-22 输入 /输出 流 
open0 函 数 用 来 打开 文件 。open0 函 数 需要 一 个 字符 串 路 径 ， 表 明 希 望 打 开 文件 ， 并 运 
回 一 个 文件 对 象 。 其 语法 格式 如 下 : 
fileobj=open (filename[,mode[,buffering]]) 


其 中 ，fileobj 是 open0 函 数 返 回 的 文件 对 象 。 参数 filename (文件 名 ) 是 必 写 参数 ， 它 既 可 
以 是 绝对 路 径 ， 也 可 以 是 相对 路 径 。 模 式 (mode) 和 缓冲 〈buffering) 为 可 选项 。mode 
是 指明 文件 类 型 和 操作 的 字符 串 ， 可 以 使 用 的 值 如 表 1-12 所 示 。 
表 1-12 open() 函 数 中 mode 参数 的 常用 值 


值 描 述 

rT 读 模 式 ， 如 果 文 件 不 存在 ， 则 发 生 异常 

'w， | 写 模式 ， 如 果 文件 不 存在 ， 则 先 创建 文件 再 打开 ; 如 果 文件 存在 ， 则 清空 文件 内 容 再 打开 

, ， ”| 追加 模式 ， 如 果 文件 不 存在 ， 则 先 创建 文件 再 打开 ， 如 果 文件 存在 ， 打 开 文件 后 将 新 内 容 妃 

加 到 原 内 容 之 后 

心 ”| 三 进 制 模式 ， 可 添加 到 其 他 模式 中 使 用 

中 | 读 / 写 模式 ， 可 添加 到 其 他 模式 中 使 用 

说 明 : 

(1) 当 mode 参数 省 略 时 ， 可 以 获得 能 读 取 文件 内 容 的 文件 对 象 ， 即 Tt' 是 mode 参数 的 
默认 值 。 


(2) 中 参数 指明 读 和 写 都 是 允许 的 ， 可 以 用 到 其 他 任何 模式 中 。 例 如， 可 以 用 'r+' 打 开 
一 个 文本 文件 并 读 / 写 。 

(3) b' 参 数 改 变 处 理 文件 的 方法 。 通 常 ，Python 处 理 的 是 文本 文件 ， 当 处 理 二 进 制 文 
件 例如 声音 文件 或 图 像 文 件 ) 时 应 该 在 模式 参数 中 增加 b'。 例 如 ， 可 以 用 'rb' 来 读 取 一 个 
二 进 制 文件 。 

open0 函 数 的 第 3 个 参数 一 一 buffering 用 来 控制 缓冲 。 当 该 参数 取 0 或 False 时 ，IO 
是 无 缓冲 的 ， 所 有 读 / 写 操作 直接 针对 硬盘 。 当 该 参数 取 1 或 True 时 ，IO 有 缓冲 ， 此 时 
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Python 使 用 内 存 代替 硬盘 ， 使 程序 的 运行 速度 更 快 ， 只 有 在 使 用 flush0 或 close0 时 才 会 将 
数据 写 入 硬盘 。 当 参数 大 于 1 时 ， 表 示 缓 冲 区 的 大 小 ， 以 字 节 为 单位 ， 负 数 表示 使 用 默认 
缓冲 区 大 小 。 

下 面 举例 说 明 open() 函 数 的 使 用 。 

先 用 记事 本 创建 一 个 文本 文件 ， 取 名 为 hello.txt， 然 后 输入 以 下 内 容 ， 保 存在 D 盘 的 
python 文件 夹 中 : 
Hello! 

Henan Zhengzhou 


在 交互 式 环境 中 输入 以 下 代码 : 
>>> helloFile=open("D:\\python\\hello.txt") 


这 条 命令 将 以 读 取 文 本 文件 的 方式 打开 放 在 DD 盘 Python 文 件 夹 下 的 hello.txt 文 件 “ 读 
模式 ”是 Python 打开 文件 的 默认 模式 。 当 文件 以 读 模式 打开 时 ， 只 能 从 文件 中 读 取 数据 ， 
不 能 向 文件 写 入 或 修改 数据 。 

当 调用 open(O) 函 数 时 将 返回 一 个 文件 对 象 , 在 本 例 中 文件 对 象 保存 在 helloFile 变量 中 。 

>>> print (helloFile) 

<_io.TextIOWrapper name='D:\\python\\hello.txt' mode='r' encoding='cp936'> 


在 打印 文件 对 象 时 可 以 看 到 文件 名 、 读 / 写 模式 和 编码 格式 。cp936 是 指 Windows 系统 
中 的 第 936 号 编码 格式 ， 即 GB2312 的 编码 。 接 下 来 就 可 以 调用 helloFile 文件 对 象 的 方法 
读 取 文 件 中 的 数据 了 。 


1.5.2 ” 读 取 文 本 文件 


上 户 可 以 调用 文件 对 象 的 多 种 方法 读 取 文 件 内 容 。 

@ read0 方 法 

不 设置 参数 的 read() 方 法 将 整个 文件 的 内 容 读 取 为 一 个 字符 串 。read() 方 法 一 次 读 取 文 
件 的 全 部 内 容 , 性 能 根据 文件 大 小 而 变化 , 例如 1GB 的 文件 在 读 取 时 需要 使 用 同样 大 小 的 
内 存 。 


贺 1-29 调用 read() 方 法 读 取 hello.txt 文件 中 的 内 容 。 


helloFile=open("D:\\python\\hello.txt") 
fileContent=helloFile.read() 
helloFile.close() 

print (fileContent) 


输出 结果 : 


Hello! 
Henan Zhengzhou 


户 也 可 以 设置 最 大 读 入 字符 数 来 限制 read0 函 数 一 次 返回 的 大 小 。 
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[ 贺 1-30 设置 参数 一 次 读 取 3 个 字符 来 读 取 文 件 。 


helloFile=open("D:\\python\\hello.txt") 
fileContent="" 
whileTrue: 
fragment=helloFile.read(3) 
if fragment=="": # 或 者 if not fragment 
break 
fileContent+=fragment 
helloFile.close() 
print (fileContent) 


在 读 到 文件 结尾 之 后 , read() 方 法 会 返回 空 字符 串 ， 此 时 fragment=="" 成 立 , 退出 循环 。 
四 readline() 方 法 
Ieadline() 方 法 从 文件 中 获取 一 个 字符 串 ， 每 个 字符 串 就 是 文件 中 的 每 一 行 。 
[ 圆 1-31 调用 readline0 方 法 读 取 hello.txt 文件 中 的 内 容 。 


helloFile=open("D:\\python\\hello.txt") 
fileContent="" 
whileTrue: 
line=helloFile.readline() 
if line=="": # 或 者 if not line 
break 
fileContent+=line 
helloFile.close() 
print (fileContent) 


当 读 取 到 文件 结尾 之 后 ，readline() 方 法 同样 返回 空 字 符 串 ， 使 得 line 一 "成 立 ， 跳 出 
循环 。 

全 readlines0 方 法 

readlines( 方 法 返回 一 个 字符 串 列表 ， 其 中 的 每 一 项 是 文件 中 每 一 行 的 字符 让 

[加 1-32 使 用 readlines() 方 法 读 取 文件 内 容 。 

helloFile=open("D:\\python\\hello.txt") 

fileContent=helloFile.readlines () 

helloFile.close() 

print (fileContent) 


for line in fileContent:  # 输 出 列表 
print (line) 


readlines() 方 法 也 可 以 设置 参数 ， 指 定 一 次 读 取 的 字符 数 。 


1.5.3” 写 文本 文件 


写 文件 和 读 文件 相似 ， 都 需要 先 创建 文件 对 象 连接 ， 所 不 同 的 是 ， 打 ”视频 讲解 
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开 文件 时 是 以 写 模 式 或 添加 模式 打开 。 如 果 文 件 不 存在 ， 则 创建 该 文件 。 

与 读 文 件 时 不 能 添加 或 修改 数据 类 似 ， 写 文件 时 也 不 允许 读 取 数据 。 在 用 写 模式 打开 
己 有 文件 时 会 覆盖 文件 的 原 有 内 容 ， 从 头 开始 ， 就 像 用 一 个 新 值 覆 写 一 个 变量 的 值 。 

>>> helloFile=open ("D:\\python\\hello.txt", "w") 

# 用 写 模式 打开 已 有 文件 时 会 覆盖 文件 的 原 有 内 容 
>>> fileContent=helloFile.read() 
Traceback (most recent call last): 
File "<pyshell#1>", line 1, in <module> 
fileContent=helloFile.read() 

IOError: File not open for reading 

>>> helloFile.close() 

>>> helloFile=open ("D:\\python\\hello.txt") 

>>> fileCcontent=helloFile.read() 

>>> len (fileContent) 

0 

>>> helloFile.close() 


于 用 写 模 式 打开 已 有 文件 时 文件 的 原 有 内 容 被 清空 , 所 以 再 次 读 取 内 容 时 长 度 为 0。 
@ write0 方 法 

write() 方 法 用 于 将 字符 串 参数 写 入 文件 。 

[ 贺 1-33 用 write0 方 法 写 文件 。 
helloFile=open("D:\\python\\hello.txt", "w") 
helloFile.write("First line.\nSsecond line.\n") 
helloFile.close() 
helloFile=open("D:\\python\\hello.txt","a") 
helloFile.write("third line. ") 
helloFile.close() 
helloFile=open("D:\\python\\hello.txt") 
fileContent=helloFile.read() 

helloFile.close() 

print (fileContent) 


结果 : 

First line. 

Second line. 

third line. 

当 以 写 模式 打开 文件 hello.txt 时 ， 文 件 的 原 有 内 容 被 覆盖 。 调 用 write() 方 法 将 字符 串 
参数 写 入 文件 ， 这 里 “m” 代 表 换行 符 。 关 闭 文件 之 后 再 次 以 添加 模式 打开 文件 hello.txt， 
调用 write() 方 法 写 入 的 字符 串 “third line.” 被 添加 到 了 文件 末尾 。 最 终 以 读 模 式 打开 文件 
后 读 取 到 的 内 容 共 有 3 行 字符 串 。 

注意 ，write0 方 法 不 能 自动 在 字符 串 末 尾 添加 换行 符 ， 需 要 用 户 自己 添加 “\n”。 

[ 夯 ]1-34 完成 一 个 自 定义 函数 copy_file0， 实 现 文件 的 复制 功能 。 

copy _file0 函 数 需要 两 个 参数 ， 指 定 需 要 复制 的 文件 oldfile 和 文件 的 备份 newfile。 分 
别 以 读 模式 和 写 模 式 打 开 两 个 文件 ， 从 oldfile 一 次 读 入 50 个 字符 并 写 入 newfile。 当 读 到 
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文 作 


行 


意 w 


从 入 门 到 实战 一 一 爬虫 、 游 戏 和 机 器 学 习 
尾 时 fleContent 一 "成 立 ， 退 出 循环 并 关闭 两 个 


末 


def copy file(oldfile,newfile) : 
oldFile=open(oldfile,"r") 
newFile=open (newfile,"w") 
whileTrue: 
fileContent=oldFile.read(50) 
if fileContent=="": ， 间 读 到 文件 末尾 时 
break 
newFile.write (fileContent) 
oldFile.close() 
newFile.close() 
return 


文件 。 


copy_file("D:\\python\\hello.txt","D:\\python\\hello2.txt") 


四 writelines0 方 法 
writelines(sequence) 方 法 向 文件 写 入 一 个 序列 字符 是 
的 换行 符 。 

obj=open ("log.txt", "w") 
Tist2={["11", "test "hello™, 
obj .writelines (1ist2) 

obj .close () 


"44"，"55"] 


列表 ,如果 需要 换行 则 要 自己 加 入 


运行 结果 是 生成 一 个 "log.txt" 文 件 ， 内 容 是 “1ltesthello4455”， 可 见 没 有 换行 。 另 外 注 


ritelines() 方 法 写 入 的 序列 必须 是 字符 串 序列 ， 整 数 


1.5.4 文件 内 移动 


无 论 是 读 或 写 文件 ,Python 都 会 跟踪 文件 中 的 读 / 写 位 置 。 在 默认 情况 
下 ， 文 件 的 读 / 写 都 是 从 文件 的 开始 位 置 进行 。Python 提供 了 控制 文件 读 / 


序列 会 产生 错误 。 


所 
0 


视频 讲解 


写 起 始 位 置 的 方法 ， 使 得 用 户 可 以 改变 文件 读 / 写 操作 发 生 的 位 置 。 


复制 


表 ， 其 中 的 每 一 个 元 素 都 有 自己 的 索引 ， 文 件 对 象 按 字 节 对 缓冲 


当 使 
到 缓冲 


open0) 函 数 打 开 文 件 时 , open0) 函 数 在 内 存 
区 。 在 文件 内 容 复制 到 文件 对 象 缓冲 区 后 ， 


创建 缓冲 区 , 将 磁盘 上 的 文件 内 容 
文件 对 象 将 缓冲 区 视 为 一 个 大 的 列 
区 索引 计数 。 同 时 ， 文 件 


对 象 对 文件 当前 位 置 〈 即 当前 读 / 写 操作 发 生 的 位 置 ) 进行 维护 ， 如 图 1-23 所 示 。 许 多 方 


法 隐 


式 使 


文件 缓冲 区 


文件 当前 位 置 


图 1-23 文件 当前 位 置 


当前 位 置 。 例 如 在 调用 readline() 方 法 后 ， 文 件 当前 位 置 移动 到 下 一 个 回 车 处 。 
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了 Python 使 用 一 些 函 数 跟踪 文件 当前 位 置 。tell0 函 数 可 以 计算 文件 当前 位 置 和 开始 位 置 
之 间 的 字 节 偏 移 量 。 


>>> exampleFile=open ("D:\\python\\example.txt","w") 
>>> exampleFile.write("0123456789") 

>>> exampleFile.close() 

>>> exampleFile=open ("D:\\python\\example.txt") 

>>> exampleFile.read(2) 


>>> exampleFile.read(2) 
>>> exampleFile.tell() 


>>> exampleFile.close() 


这 里 ，exampleFile.tell0 函 数 返回 的 是 一 个 整数 4， 表 示 文 件 当前 位 置 和 开始 位 置 之 间 
有 4 个 字 节 偏 移 量 。 因 为 已 经 从 文件 中 读 取 4 个 字符 了 ， 所 以 为 4 个 字 节 偏 移 量 。 

seek(O 函 数 设置 新 的 文件 当前 位 置 ， 允 许 在 文件 中 跳 转 ， 实 现 对 文件 的 随机 访问 。 

seek() 函 数 有 两 个 参数 ， 第 1 个 参数 是 字 节 数 ， 第 2 个 参数 是 引用 点 。seekO 函 数 将 文 
件 当前 指针 由 引用 点 移动 指定 的 字 节 数 到 指定 的 位 置 。 其 语法 格式 如 下 : 

seek (offset[,whence]) 


说 明 : offset 是 一 个 字 节 数 ， 表 示 偏 移 量 ， 引 用 点 whence 有 下 面 3 个 取 值 。 

。 文件 开始 处 为 0， 这 也 是 默认 取 值 ， 意 味 着 使 用 该 文件 的 开始 处 作为 基准 位 置 ， 此 
时 字 节 偏 移 量 必须 非 负 。 

。 当前 文件 位 置 为 1， 则 是 使 用 当前 位 置 作为 基准 位 置 ， 此 时 偏 移 量 可 以 取 负 值 。 

。 文件 结尾 处 为 2， 则 该 文件 的 末尾 将 被 作为 基准 位 置 。 


1.5.5 文件 的 关闭 


用 户 应 该 牢记 使 用 close0) 方 法 关闭 文件 ,关闭 文件 是 取消 程序 和 文件 之 间 连 接 的 过 程 ， 
内 存 缓冲 区 中 的 所 有 内 容 将 写 入 磁盘 ,因此 必须 在 使 用 文件 后 关闭 文件 确保 信息 不 会 丢失 。 
如 果 要 确保 文件 关闭 ， 可 以 使 用 try/finally 语句 ， 在 finally 子 句 中 调用 close0 方 法 : 


helloFile=open("D:\\python\\hello.txt","w") 
EY 


helloFile.write ("Hello, Sunny Day!") 
finally: 
helloFile.close() 


也 可 以 使 用 with 语句 自动 关闭 文件 : 


with open("D:\\python\\hello.txt") as helloFile: 
s=helloFile.read() 
print (s) 
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从 入 门 到 实战 一 故 虫 、 游 戏 和 机 器 学 习 
with 语句 可 以 打开 文件 并 赋值 给 文件 对 象 ， 之 后 就 可 以 对 文件 进行 操作 了 。 文 件 会 在 


语句 结束 后 自动 关闭 ， 即 使 是 由 于 异常 引起 的 结束 也 是 如 此 。 


1.5.6 二进制 文件 的 读 / 写 


是 十 


HR 
也 


因为 string 是 以 字 节 为 单位 的 。 


Python 没有 二 进 制 类 型 ， 但 是 可 以 用 string (字符 串 ) 类 型 来 存储 二 进 制 类 型 数据 ， 
回 演 演 且 回 


@ 数据 转换 成 字 节 串 

pack() 方 法 可 以 把 数据 转换 成 字 节 串 〈 以 字 节 为 单位 的 字符 串 )。 
格式 如 下 : 
pack (格式 化 字符 串 ， 数 据 ) 

格式 化 字符 串 中 可 用 的 格式 字符 见 表 1-13 中 的 格式 字符 。 例 如 : 
import struct 

a=20 

bytes=struct.pack('i',a) # 将 a 变 为 字符 串 

print (bytes) 

结果 如 下 : 

b'\x14\x00\x00\x00' 

此 时 bytes 就 是 一 个 字符 串 ,该 字符 串 按 字 节 和 a 的 二 进 制 存 储 内 容 相同 。 在 结果 中 x 
六 进 制 的 意思 ，20 的 十 六 进 制 是 14。 

如 果 是 由 多 个 数据 构成 的 ， 可 以 这 样 : 

a='hello' 

b="'world!' 

c=2 

d=45.123 
bytes=struct.pack('5s6sif',a.encode('utf-8'),b.encode('utf-8'),c,d) 
'5s6sif 就 是 格式 化 字符 串 ， 由 数字 加 字符 构成 。 其 中 ，5s 表示 占 5 个 字符 宽度 的 字符 
2i 表示 两 个 整数 。 表 1-13 是 可 用 的 格式 字符 及 对 应 C 语言 、Python 语言 中 的 类 型 。 


sto 


视频 讲解 


表 1-13 格式 字符 
格式 字符 C 语言 中 的 类 型 了 Python 语言 中 的 类 型 字 节 数 
6 char string of length 1 1 
b signed char integer 1 
B unsigned char integer 上 
号 _Bool bool 1 
h short integer 2 
H unsigned short integer 2 
1 int integer 4 
I unsigned int integer or long 4 
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续 表 

格式 字符 C 语言 中 的 类 型 Python 语言 中 的 类 型 字 节 数 

1 long integer 4 

E unsigned long long 4 

q long long long 8 

Q unsigned long long long 8 

float float 4 

d double float 8 

S char[] string 1 

Pp char[] string 1 

P Void * long 与 OS 有关 


bytes=struct.pack('5s6sif',a.encode ('utf-8'),b.encode ('utf-8'),c,d) 
此 时 的 bytes 就 是 二 进 制 形式 的 数据 了 ， 可 以 直接 写 入 文件 。 例 如 : 
binfile=open ("D:\\python\\hellobin.txt", "wb") 


binfile.write (bytes) 
binfile.close() 


@ 字 节 串 还 原 成 数据 
unpack() 方 法 可 以 把 相应 数据 的 字 节 串 〈 以 字 节 为 单位 的 字符 串 ) 还 原 成 数据 。 
bytes=struct .pack('i',20) # 将 20 变 为 字符 串 


再 进行 反 操作 ， 现 有 二 进 制 数据 bytes (其 实 就 是 字符 串 )， 将 它 反 过 来 转换 成 Python 


的 数据 类 型 : 


a,=struct.unpack('i',bytes) 
注意 ，unpack(0) 返 回 的 是 元 组 。 所 以 ， 如 果 只 有 一 个 变量 : 


bytes=struct .pack('i',a) 


那么 解码 的 时 候 需 要 这 样 : 


a,=struct .unpack('i',bytes) 或 者 (a,)=struct.unpack('i',bytes) 


如 果 直 接 用 a=struct.unpack('i',bytes)， 那 么 a=(20,)， 是 一 个 tuple 而 不 是 原来 的 整数 。 
例如 把 DD 盘 python 文件 夹 下 hellobin.txt 文件 中 的 数据 读 取 并 显示 。 


import struct 
binfile=open ("D:\\python\\hellobin.txt", "rb") 
bytes=binfile.read() 
(avbvc,d)=struct.unpack('5s6sif',bytes) 

# 通 过 struct .unpack () 解码 成 Python 变量 
t=struct.unpack('5s6sif',bytes) 

# 通 过 struct .unpack () 解码 成 元 组 
print (七 ) 
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| ee 项 目 案 例 


从 入 门 到 实战 一 一 疏 虫 、 游 戏 和 机 器 学 习 
读 取 结果 : 


(bhello', b"'world!, 2, 45.12300109863281) 


1.6 Python 的 第 三 方 库 


Python 语言 有 标准 库 和 第 三 方 库 两 类 库 , 标准 库 随 Python 安装 包 一 起 发 布 ， 


户 可 以 


随时 使 用 ， 第 三 方 库 需要 在 安装 后 才能 使 用 。 由 于 Python 语言 经 历 了 数 次 版 本 更 迭 , 而 且 
第 三 方 库 由 全 球 开发 者 分 布 式 维护 ,缺少 统一 的 集中 管理 ， 所 以 Python 第 三 方 库 曾经 一 度 
制约 了 Python 语言 的 普及 和 发 展 。 随 着 官方 pip 工具 的 应 用 ，Python 第 三 方 库 的 安装 变 得 
十 分 容易 。 常 用 Python 第 三 方 库 如 表 1-14。 


表 1-14 常用 Python 第 三 方 库 


库 名 称 库 用 途 
Django 开源 Web 开发 框架 ， 它 鼓励 快速 开发 ， 并 遵循 MVC 设计， 比较 好 用 ， 开 发 周期 短 
webpy 一 个 小 巧 灵活 的 Web 框架 ， 虽 然 简单 ， 但 是 功能 强大 
Matplotlib 用 Python 实现 的 类 matlab 的 第 三 方 库 ， 用 于 绘制 一 些 高 质量 的 数学 二 维 图 形 
SciPy 基于 Python 的 matlab 实现 ， 旨 在 实现 matlab 的 所 有 功能 
NumPy 基于 Python 的 科学 计算 第 三 方 库 ， 提 供 了 和 矩阵、 线性 代数 、 传 立 叶 变换 等 解决 方案 
PyGtk 基于 Python 的 GUI 程序 开发 GTK+ 库 
PyQt 用 于 Python 的 QT 开发 库 
WxPython Python 下 的 GUI 编程 框架 ， 与 MFC 的 架构 相似 
BeautifulSoup | 基于 Python 的 HTML/XML 解析 器 ， 简 单 易 用 
PIL 基于 Python 的 图 像 处 理 库 ， 功 能 强大 ， 对 图 形 文件 的 格式 支持 广泛 
MySQLdb 用 于 连接 MySQL 数据 
Pygame 基于 Python 的 多 媒体 开发 和 游戏 软件 开发 模块 
Py2exe 将 Python 脚本 转换 为 Windows 上 可 以 独立 运行 的 可 执行 程序 
pefile Windows PE 文件 解析 器 


最 常用 且 最 高 效 的 Python 第 三 方 库 的 安装 方式 是 采用 pip 工具 安装 。pip 是 Python 官 
供 并 维护 的 在 线 第 三 方 库 安装 工具 。 对 于 同时 安装 Python2 和 Python3 环境 为 系统 的 
情况 ， 建 议 采 用 pip3 命令 专门 为 Python3 版 安装 第 三 方 库 。 


方 提 


中 。 


注意 ，pip 是 在 命令 行 下 〈cmd) 运行 的 工具 。 


D:\>pip install pygame 


户 也 可 以 卸载 Pygame 库 ， 撮 载 过 程 可 能 需要 用 户 确 认 。 


D:\>pip uninstall pygame 


用 户 还 可 以 通过 list 子 命令 列 出 当前 系统 中 已 经 安装 的 第 三 方 库 ， 例 如 : 


D:\>pip list 


例如 安装 Pygame 库 ，pip 工具 默认 从 网 络 上 下 载 Pygame 库 安 装 文件 并 自动 装 到 系统 


pip 是 Python 第 三 方 库 最 主要 的 安装 方式 , 可 以 安装 超过 90% 以 上 的 第 三 方 库 。 然而 ， 


由 于 一 些 历史 、 技 术 等 原因 ， 还 有 一 些 第 三 方 库 暂 时 无 法 用 pip 安装 ， 此 时 需要 | 


安装 方法 例如 下 载 库 文件 后 手工 安装 )。 
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其 他 的 


2.1 猜 单 词 游 戏 功能 介绍 


猜 单词 游戏 就 是 计算 机 随机 产生 一 个 单词 ， 打 乱 字 母 顺序 ， 供 玩家 去 尚 训 
猜 。 此 游戏 采用 控制 字符 界面 ， 运 行 界面 如 图 2-1 所 示 。 


池 参 i 
于 尖 交 四 闪闪 缚 naga 
乱 序 后 单词 : luebjm 


请 你 猜 ; jumble 
a y 


单词 : oionispt 
后 单词 : t nn op 
请 你 猜 : 


视频 讲解 


图 2-1 猜 单词 游戏 程序 的 运行 界面 


2.2 程序 设计 的 思路 


在 游戏 中 需要 随机 产生 单词 以 及 数字 ， 所 以 引入 random 模块 随机 数 函数 ， 其 中 
random.choice() 可 以 从 序列 中 随机 选取 元 素 。 例 如 : 


井 创 建 单词 序列 元 组 
WORDS= ("python", "jumble", "easy", "difficult", "answer", "continue", 
"phone", "position", "position", "game") 


| 号 本 项 目 案例 开 


从 入 门 到 实战 一 一 怜 虫 、 游 戏 和 机 器 学 习 
井 从 序列 中 随机 挑 出 一 个 单词 


word=random.choice (WORDS) 


word 就 是 从 单词 序列 中 随机 挑 出 一 个 单词 。 
在 游戏 中 随机 挑 出 一 个 单词 word 后 ， 如 何 把 单词 word 的 字母 顺序 打 乱 ? 方法 是 随机 
从 单词 字符 串 中 选择 一 个 位 置 position, 把 position 位 置 的 那个 字母 加 入 乱 序 后 单词 jumble， 
同时 将 原单 词 word 中 position 位 置 的 那个 字母 删 去 (通过 连接 position 位 置 前 字符 串 和 划 
后 字符 串 实现 )。 通 过 多 次 循环 就 可 以 产生 新 的 乱 序 后 单词 jumble。 
while word: #word 不 是 空 串 循环 
# 根 据 word 长 度 产 生 word 的 随机 位 置 
position=random.randrange (len (word) ) 
# 将 Position 位 置 的 字母 组 合 到 乱 序 后 单词 
jumble+=word[position] 
# 通 过 切片 ， 将 position 位 置 的 字母 从 原单 词 中 删除 
word=word[:position]+word[ (position+1):] 
print (" 乱 序 后 单词 :"，jumble) 


2.3 ”关键 技术 一 一 random 模块 


random 模块 可 以 产生 一 个 随机 数 或 者 从 序列 中 获取 一 个 随机 元 素 , 它 的 常用 方法 和 使 
用 例子 如 下 : 

@ 常用 方法 

1) random.random() 

random.random() 用 于 生成 一 个 随机 小 数 n，0<n<1.0。 


import random 
Frandom.random() 


执行 以 上 代码 的 输出 结果 如 下 : 


0.85415370477785668 


2) random.uniform(a, b) 

random.uniform(a, b)， 用 于 生成 一 个 指定 范围 内 的 随机 小 数 ， 两 个 参数 中 一 个 是 上 限 ， 
一 个 是 下 限 。 如 果 a<b， 则 生成 的 随机 数 n 有 a<n<b; 如 果 a>b， 则 b<n<a。 

代码 如 下 : 


import random 


print (random.uniform(10, 20)) 
print (random.uniform(20, 10)) 


执行 以 上 代码 的 输出 结果 如 下 : 


14.247256006293084 
15.53810495673216 
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3) random.randint(a,b) 
random.randint(a,b) 用 于 随机 生成 一 个 指定 范围 内 的 整数 ， 其 中 参数 a 是 下 限 ， 参 数 b 
是 上 限 ， 生 成 的 随机 数 n 有 a<n<b。 


import random 

print (random.randint (12，20))  # 生 成 的 随机 数 n 有 12<n<20 

print (random.randint (20，20))  # 结 果 永远 是 20 

#print (random.randint (20，10) ) # 该 语句 是 错误 的 ， 下 限 必须 小 于 上 限 


4) random.randrange([start],stopl[,step]) 

random randrange([start],stop[,step]) 用 于 从 指定 范围 内 按 指定 基数 递增 的 集合 中 获取 一 
个 随机 数 。 例 如 random.randrange(10,100,2)， 结 果 相 当 于 从 [10,12,14,16,…,96,98] 序 列 中 获 
取 一 个 随机 数 。random.randrange(10.100,2) 在 结果 上 与 random.choice(range(10,100,2)) 
等 效 。 

5) random.choice() 

random.choice() 从 序列 中 获取 一 个 随机 元 素 ， 其 原型 为 random.choice(sequence)， 参 数 
sequence 表示 一 个 有 序 类 型 。 这 里 要 说 明 一 下 , sequence 在 Python 中 不 是 一 种 特定 的 类 型 ， 
而 是 泛 指 序列 数据 结构 。 列表、 元 组 、 字 符 串 都 属于 sequence。 下 面 是 使 用 random.choice() 
的 一 些 例子 : 


import random 


print (random.choice ("学 习 Python")) ## 从 字符 串 中 随机 取 一 个 字符 
print (random.choice(["JGood", "is", "a", "handsome", "boy"])) 
# 从 1ist 列表 中 随机 取 


print (random.choice( ("Tuple", "List", "Dict"))) # 从 tuple 元 组 中 随机 取 
执行 以 上 代码 的 输出 结果 如 下 : 

学 

is 

Dict 

当然 ， 每 次 运行 的 结果 都 不 一 样 。 

6) random.shuffle(x[.random]) 

random.shuffle(x[, random]) 用 于 将 一 个 列表 中 的 元 素 打 乱 ， 例 如 : 


p=["Python", "is", "powerful", "simple", "and so on..."] 
random. shuffle (p) 
print (p) 


执行 以 上 代码 的 输出 结果 如 下 : 

ewerfoal’y "Simnpley iar python. "and so RS 二 
在 发 牌 游戏 案例 中 使 用 此 方法 打 乱 牌 的 顺序 实现 洗 牌 功能 。 

7) random.sample(sequence, k) 


random.sample(sequence, ]) 用 于 从 指定 序列 中 随机 获取 指定 长 度 的 片段 ，sampleO 函 数 
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不 会 


on 项 目 案例 开发 
从 入 门 到 实战 一 一 仆 虫 、 游 戏 和 机 器 学 习 


修改 原 有 序列 。 

llet=Tl Zr 3x de Sy To Br 9 LO 

slice=random.sample (list, 5) 才 从 1ist 中 随机 获取 5 个 元 素 作为 一 个 片段 返回 
print (slice) 

print (1ist) # 原 有 序列 并 没有 改变 


执行 以 上 代码 的 输出 结果 如 下 : 

IS. 2. 4. 90 71 
SEA 
@ 使 用 举例 

以 下 是 常用 情况 举例 : 

1) 随机 字符 


>>> import random 
>>> random.choice('abcdefg&#%^*f£f") 


其 结果 为 'd'。 
2) 在 多 个 字符 中 选取 特定 数量 的 字符 


>>> import random 


>>>random.sample('abcdefghij', 3) 
其 结果 为 [a', 'd', b]。 
3) 在 多 个 字符 中 选取 特定 数量 的 字符 组 成 新 字符 


>>> import random 
> "ioin(trandon ample(l a, "Du er dr en Eu he dj 


ut 


Smaplaced™ Tre 


其 结果 为 'ajh'。 
4) 随机 选取 字符 串 


>>> import random 


>>> random.choice(['apple', 'pear', 'peach', 'orange', 'lemon']) 


其 结果 为 lemon'。 

5) 洗 牌 

>>> import random 

>>> items=[1, 2, 3, 4, 5, 6] 
>>> random.shuffle (items) 


>>> items 


其 结果 为 [3,2,5,6.4,1]。 
6) 随机 选取 0 到 100 之 间 的 偶数 


>>> import random 


>>> random.randrange (0, 101, 2) 
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其 结果 为 和 42。 
7) 随机 生成 1 一 100 之 间 的 小 数 


>>> random.uniform(1, 100) 


其 结果 为 5.4221167969800881。 


2.4 程序 设计 的 步骤 


猜 单 词 游 戏 程序 的 代码 如 下 : 
# 猜 单词 游戏 

import random 

# 创 建 单词 序列 


WORDS= ("python", "jumble", "easy", "difficult", "answer", "continue", 


"phone", "position", "pose", "game") 
# 开 始 游戏 
print( 
欢迎 参加 猜 单 词 游戏 
把 字母 组 合成 一 个 正确 的 单词 . 
) 
iscontinue="y" 
while iscontinue=="y" or iscontinue=="Y": 
# 从 序列 中 随机 挑 出 一 个 单词 
word=random.choice (WORDS) 
# 一 个 用 于 判断 玩家 是 否 猜 对 的 变量 
correct=word 
# 创 建 乱 序 后 单词 
jumble="" 
while word: #word 不 是 空 串 循环 
# 根 据 word 长 度 产生 word 的 随机 位 置 
position=random.randrange (len (word)) 
# 将 position 位 置 的 字母 组 合 到 乱 序 后 单词 
jumble+=word [position] 
# 通 过 切片 将 position 位 置 的 字母 从 原单 词 中 删除 
word=word[:position]+word[ (position+1):] 
print (" 乱 序 后 单词 :"，jumble) 


guess=input ("\n 请 你 猜 : ") 

while guess!=correct and guess!="": 
print ("对 不 起 不 正确 .") 
guess=input ("继续 猜 : ") 
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3.1 智力 问答 测试 功能 介绍 


智力 问答 测试 ， 内 容 涉及 历史 、 经 济 、 风 情 、 民 俗 、 地 理 、 人 文 等 古今 中 外 各 方面 的 


知识 ， 让 玩家 在 轻松 娱乐 、 益 智 、 搞 笑 的 同时 不 知 不 觉 地 增长 知识 。 在 答题 过 程 中 对 做 对 、 


做 


错 进行 实时 跟踪 ， 测 试 完成 后 能 根据 玩家 的 答题 情况 给 出 成 绩 。 程 序 运行 界面 如 图 3-1 所 示 。 


图 3-1 智力 问答 测试 程序 的 运行 界面 


3.2 ”程序 设计 的 思路 


程序 使 用 了 一 个 SQLite 试题 库 test2.db， 其 中 每 个 智力 问答 由 题目 、4 个 选项 和 了 


答案 组 成 question、Answer A、Answer B、Answer C、Answer D、right Answer)。 


E 确 
在 


测试 前 ， 程 序 从 试题 库 test2.db 读 取 试 题 信息 ， 存 储 到 values 列表 中 。 在 测试 时 ， 顺 序 从 
values 列表 读 出 题目 显示 在 GUI 界面 中 供用 户 答题 。 在 进行 界面 设计 时 ， 智 力 问答 题目 是 
标签 控件 ，4 个 选项 是 单 选 按钮 控件 ， 在 “下 一 题 ”按钮 单 击 事件 中 实现 题目 切换 和 对 错 
判断 ， 如 果 正 确 则 得 分 score 加 10 分 ， 错 误 不 加 分 ， 并 判断 用 户 是 否 做 完 。 在 “结果 ” 按 


| 了 二 项 目 案例 开发 
从 入 门 到 实战 一 一 爬虫 、 游 戏 和 机 器 学 习 


钮 单 击 事件 中 实现 得 分 score 的 显示 。 


3.3 ”关键 技术 


从 Python2.5 版 本 以 上 就 内 置 了 SQLite3, 所 以 在 Python 中 使 用 SQLite 
不 需要 安装 任何 东西 ， 直 接 使 用 。SQLite3 数据 库 使 用 SQL 语言 。SQLite 
作为 后 端 数据 库 ， 可 以 制作 有 数据 存储 需求 的 工具 。Python 标准 库 中 的 
SQLite3 提供 该 数据 库 的 接 


3.3.1 访问 数据 库 的 步骤 


从 Python2.5 开始 ，SQLite3 就 成 了 Python 的 标准 模块 ， 这 也 是 Python 中 的 唯一 一 个 
数据 库 接口 类 模块 ， 大 大 方便 了 用 户 使 用 Python SQLite 数据 库 开发 小 型 数据 库 应 用 系统 。 

Python 的 数据 库 模 块 有 统一 的 接口 标准 ， 所 以 数据 库 操作 有 统一 的 模式 ， 操 作 数 据 库 
SQLite3 主要 分 为 以 下 几 步 : 

@ 导入 Python SQLite 数据 库 模块 

Python 标准 库 中 带 有 sqlite3 模块 ， 可 直接 导入 : 


import sqlite3 


四 建立 数据 库 连接 ， 返 回 Connection 对 象 
使 用 数据 库 模 块 的 connectO 函 数 建立 数据 库 连 接 ， 返 回 连接 对 象 con。 
con=sqlite3.connect (connectstring) # 连 接 到 数据 库 ， 返 回 sqlite3 .connection 对 象 
说 明 : connectstring 是 连接 字符 串 。 对 于 不 同 的 数据 库 连 接 对 象 ， 其 连接 字符 串 的 格 
式 不 同 ，sqlite 的 连接 字符 串 为 数据 库 的 文件 名 ， 例 如 “E:\test.db”。 如 果 指 定 连接 字符 串 
为 memory， 则 可 创建 一 个 内 存 数据 库 。 例 如 : 
import sqlite3 
con=sqlite3.connect("E:\\test.-db") 
如 果 王 盘 下 的 testdb 存在 , 则 打开 数据 库 ; 否则 在 该 路 径 下 创建 数据 库 test.db 并 打开 。 
全 创建 游标 对 象 
使 用 游标 对 象 能 够 灵活 地 对 从 表 中 检索 出 的 数据 进行 操作 ， 就 本 质 而 言 ， 游 标 实际 上 
是 一 种 能 从 包括 多 条 数据 记录 的 结果 集中 每 次 提取 一 条 记录 的 机 制 。 
调用 con.cursorO 创 建 游 标 对 象 cur: 
cur=con.cursor () # 创 建 游标 对 象 


@ 使 用 Cursor 对 象 的 execute0 方 法 执行 SQL 命令 返回 结果 集 

调用 cur.execute()、cur.executemany()、cur.executescript() 方 法 查询 数据 库 。 
。 cur.execute(sq]): 执行 SQL 语句 。 

。 cur.execute(sql, parameters): 执行 带 参数 的 SQL 语句 。 
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。 curexecutemany(sql, seq_of pqrameters): 根据 参数 执行 多 次 SQL 语句 。 

。 cur.executescript(sql script): 执行 SQL 脚本 。 

例如 创建 一 个 表 category。 

cur.execute ("create table category(id primary key, sort, name)") 

此 时 将 创建 一 个 包含 3 个 字段 id、sort 和 name 的 表 category。 下 面向 表 中 插入 记录 : 
cur.execute ("insert into category values (1，1， "computer')") 
在 SQL 语句 字符 串 中 可 以 使 用 占 位 符 “?” 表 示 参 数 ， 传 递 的 参数 使 用 元 组 。 例 如 : 
cur.execute ("insert into category values (? ，? ,? ) "，(2,， 3, 'literature')) 
@@ 获取 游标 的 查询 结果 集 

调用 cur.fetchall()、curfetchone()、cur.fetchmany() 返 回 查 询 结 果 。 

。 cur.fetchone(): 返回 结果 集 的 下 一 行 (Row 对 象 ); 无 数据 时 返回 None。 

。 curfetchall0: 返回 结果 集 的 剩余 行 (Row 对 象 列表 )， 无 数据 时 返回 空 List。 

。 cur.fetchmany(): 返回 结果 集 的 多 行 (Row 对 象 列表 )， 无 数据 时 返回 空 List。 

例如 : 

cur.execute ("select * from catagory") 

print (cur.fetchall ()) # 提 取 查 询 到 的 数据 

返回 结果 如 下 : 

[Ml Momputeor Dy (2 27 MLLEteraEure)yl 


如 果 使 用 curfetchone0， 则 首先 返回 列表 中 的 第 1 项 ， 再 次 使 用 ， 返 回 第 2 项 ， 依 次 


用 户 也 可 以 直接 使 用 循环 输出 结果 ， 例 如 : 


for row in cur.execute("select * from catagory"): 


print (row[0],row[1]) 


@ 数据 库 的 提交 和 回 深 

根据 数据 库 事物 隔离 级 别 的 不 同 ， 可 以 提交 或 回 深 。 
。 con.commit():; 事务 提交 。 

。 con.rollback(): 事务 回 滚 。 

@@ 关闭 Cursor 对 象 和 Connection 对 象 

最 后 需要 关闭 打开 的 Cursor 对 象 和 Connection 对 象 。 
。 cur.close(): 关闭 Cursor 对 象 。 

。 con.close(): 关闭 Connection 对 象 。 


3.3.2 ”创建 数据 库 和 表 


贺 3-! 创建 数据 库 sales, 并 在 其 中 创建 表 book, 表 中 包含 3 列 , 即 id、price 和 name， 
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从 入 门 到 实战 一 一 爬虫 、 游 戏 和 机 器 学 习 


h id 为 主键 (primary key)。 


# 导 入 Python SQLite 数据 库 模 块 

import sqlite3 

# 创 建 SQLite 数据 库 

con=sqlite3.connect ("E:\sales.db") 

# 创 建 表 book， 包 含 3 列 ， 即 id (主键 )、price 和 name 


con.execute ("create table book(id primary key, price, name)") 


说 明 : Connection 对 象 的 execute() 方 法 是 Cursor 对 象 对 应 方法 的 快捷 方式 ， 系 统 会 创 


建 一 个 临时 Cursor 对 象 ， 然 后 调用 对 应 的 方法 ， 并 返回 Cursor 对 象 。 


3.3.3 数据库 的 插入 、 更 新 和 删除 操作 


在 数据 库 表 中 插入 、 更 新 、 删 除 记录 的 一 般 步 又 如 下 : 
(1) 建立 数据 库 连接 。 
(2) 创建 游标 对 象 cur， 使 用 curexecute(sqD) 执 行 SQL 的 insert、update、delete 等 语句 


完成 数据 库 记录 的 插入 、 更 新 、 删 除 操作 ， 并 根据 返回 值 判断 操作 结果 。 


(3) 提交 操作 。 
(4) 关闭 数据 库 。 
加 ]-2 数据 库 表 记 录 的 插入 、 更 新 和 删除 操作 。 


import sqlite3 

books=[ ("021",25, "大 学 计算 机 "), ("022", 30，" 大 学 英语 ")，("023", 18, "艺术 欣赏 ")， 
("024", 35,， "高 级 语言 程序 设计 ") ] 

# 打 开 数 据 库 

Con=sqlite3.connect ("E:\sales.db") 

# 创 建 游标 对 象 

Cur=Con.cursor() 

# 插 入 一 行 数据 

Cur.execute ("insert into book (id,price,name) values ('001',33,' 大 学 计算 机 
多 媒体 ') ") 

Cur.execute ("insert into book (id,price,name) values(?,?,2) " , ("002",28, 
"数据 库 基础 ") ) 

# 插 入 多 行 数据 

Cur.executemany ("insert into book (id,price,name) values (?,?,?) ",books) 
# 修 改 一 行 数据 

Cur.execute ("Update book set price=? where name=? ", (25," 大 学 英语 ")) 

# 删 除 一 行 数据 

n=Cur.execute ("delete from book where price=?", (25,)) 

print ("删除 了 ",n.rowcount," 行 记录 ") 

Con.commit () 

Cur.close() 


Con.close() 
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运行 结果 如 下 : 
删除 了 2 行 记录 

3.3.4 数据 库 表 的 查询 操作 
查询 数据 库 的 步骤 如 下 : 


(1) 建立 数据 库 连接 。 
(2) 创建 游标 对 象 cur， 使 用 cur.execute(sql) 执 行 SQL 的 select 语句 。 
(3) 循环 输出 结果 。 


import sqlite3 

# 打 开 数 据 库 

Con=sqlite3.connect ("E:\sales.db") 

# 创 建 游标 对 象 

Cur=Con.cursor () 

# 查 询 数据 库 表 

Cur.execute ("select id,price,name from book") 
for TON Ln Oar 


print (row) 
运行 结果 如 下 : 
('001'，33，' 大 学 计算 机 多 媒体 ') 
('002'，28，' 数 据 库 基础 ') 
(023 97 苍术 欣 粹 矶 
('024'，35,“' 高 级 语言 程序 设计 ') 


3.3.5 ”数据库 使 用 实例 一 一 学 生 通 讯 录 


设计 一 个 学 生 通 讯 录 ， 可 以 添加 、 删 除 、 修 改 里 面 的 信息 。 


import sqlite3 

# 打 开 数 据 库 

def opendb () : 
conn=sqlite3.connect ("E:\mydb .db") 
cur=conn .execute ("create table if not exists tongxinlu(usernum 
integer primary key,username varchar(128), passworld varchar (128) ， 
address varchar(125), telnum Varchar (128) )") 
return cur, conn 

# 查 询 全 部 信息 

def showalldb () : 
| 处 理 后 的 数据 一 a 
hel=opendb () 


CUr=hel[1] .cursor() 
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从 入 门 到 实战 一 一 怜 虫 、 游 戏 和 机 器 学 习 


cur.execute ("select * from tongxinlun) 
res=cur.fetchall () 
for line in res: 
for h in line: 
print (h), 
brint 
cur.close() 


# 输 入 信息 
def into(): 


usernum=input ("请 输入 学 号 : ") 
username1=input ("请 输入 姓名 : ") 
passworld1=input ("请 输入 密码 : ") 
addressl=input ("请 输入 地 址 : ") 
telnuml=input ("请 输入 联系 电话 : ") 


return usernum,usernamel, passworldl, addressl, telnuml 


# 往 数据 库 中 添加 内 容 
def adddb () : 


WOLCOMNS= "YS 欢迎 使 用 添加 数据 功能 ---------------- mm 
print (welcome) 

person=into() 

hel=opendb () 

hel[1] .execute ("insert into tongxinlu (usernum,username, passworld, 
address, telnum)values(?,?,?,?,?)", (person[0], person[1], 
person[2], person[3],person[4])) 

hel[1] .commit () 

PELE I 恭喜 你 ， 数 据 添加 成 功 ---------------- ") 
showalldb () 

hel[1] .close() 


# 删 除数 据 库 中 的 内 容 
def deldb(): 


WelCOMe="————————-—------- 欢迎 使 用 删除 数据 库 功能 ------------------ " 
print (welcome) 

delchoice=input ("请 输入 想 要 删除 学 号 : ") 

hel=opendb () # 返 回 游标 conn 

hel [1] .execute ("delete from tongxinlu where usernum ="+delchoice) 
hel[1] .commit () 

| 恭喜 你 ， 数 据 删 除 成 功 ---------------- ") 
showalldb () 

hel[1] -close() 


# 修 改 数 据 库 的 内 容 
def alter(): 


WLCOMD 0 欢迎 使 用 修改 数据 库 功能 ----------------- ， 
print (welcome) 

changechoice=input ("请 输入 想 要 修改 的 学 生 的 学 号 : ") 

hel=opendb () 
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person=into() 
hel[1] .execute ("update tongxinlu set usernum=?,username=?, 
passworld=?,address=?, telnum=? where usernum="+changechoice, 
(person[0], person[1], person[2], person[3],person[4])) 
hel[1] .commit () 
showalldb () 
heli[li].close() 

# 查 询 数 据 

def searchdb () : 
Welcome="--=--=---=---=-=---= 欢迎 使 用 查询 数据 库 功能 ----------------- 邮 
print (welcome) 
choice=input ("请 输入 要 查询 的 学 生 的 学 号 : ") 
hel=opendb () 
cur=hel [1] .cursor() 
cur.execute ("select * from tongxinlu where usernum="+choice) 
hel[1] .commit () 


for row in cur: 
print (row[0],row[1],row[2],row[3],row[4]) 
CuUr .close() 
hel[1] .close() 
# 是 否 继续 
def conti (a): 
choice=input ("是 否 继续 ? (y or n) :") 
if choice=="'y": 
3s 
else: 
a=0 
return a 


局 


if _name 
flag=1 
while flag: 
welcome ”= 欢迎 使 用 数据 库 通讯 录 --------- 出 


print (welcome) 


1 


choiceshow=""" 

请 选择 您 的 进一步 选择 : 

(添加 》 往 数据 库 里 面 添 加 内 容 

(删除 》 删 除数 据 库 中 内 容 

(修改 ) 修 改 数据 库 的 内 容 

(查询 ) 查询 数据 库 的 内 容 

选择 您 想 要 进行 的 操作 : 
choice=input (choiceshow) 
if choice==" 添 加 ": 

adddb () 
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从 入 门 到 实战 一 一 爬虫 、 游 戏 和 机 器 学 习 


conti (flag) 
elif choice==" 删 除 ": 

deldb() 

conti (flag) 
elif choice==" 修 改 ": 

alter () 

conti (flag) 
elif choice==" 查 询 ": 

searchdb () 

conti (flag) 
else: 


print ("你 输入 错误 ， 请 重新 输入 ") 
程序 运行 界面 和 添加 记录 界面 如 图 3-2 所 示 。 


Python 3.5.2 (v3.5.2.4def2a2901a5, Jun 2 Py SD fh 6 2 dof3a20135, Jun 25 3016, 33,01 18) CSE 
tel)] on win32 ， i te copyr IE", “credits” or “license()” or aare intoraatic 
Type “copyright”, “credits” or “licenset ’ 

>» 


wm RESTART: C \Users\think\Desktop\python\li. py 
欢迎 使 用 数据 库 次 


RESTART. C: \Users\think WN, 


据 库 通讯 录 - 一 -一 


图 3-2 程序 运行 界面 和 添加 记录 界面 


3.4 程序 设计 的 步 又 
3.4.1 生成 试题 库 


import sqlite3 # 导 入 SOLite 驱动 

# 连 接 到 SQLite 数据 库 ， 数 据 库 文件 是 test .db 

# 如 果 文 件 不 存在 ， 会 自动 在 当前 目录 创建 

conn=sqlite3.connect ('test2.db') 

cursor=conn.cursor () # 创 建 一 个 Cursor 

#cursor.execute ("delete from exam") 

# 执 行 一 条 SQL 语句 ， 创 建 exam 表 

cursor.execute('create table [exam] ([question] varchar (80) null, [Answer A] 
varchar(1) null, [Answer B] varchar (1) null, [Answer C] varchar (1) null, 
[Answer D] varchar(1) null, [right Answer] varchar (1) null)') 

# 继 续 执行 一 条 SQL 语句 ， 插 入 一 条 记录 

cursor.execute ("insert into exam (question, Answer A, Answer B, Answer C, 
Rnswer _D，right Answer) values (' 哈 雷 慧 星 的 平均 周期 为 '， "54 年 '，"56 年 '，'73 
Er Ee 

cursor.execute ("insert into exam (question, Answer A, Answer B, Answer C, 
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Rnswer D，right Answer) values(' 夜 郎 自 大 中 “ 夜 郎 ” 指 的 是 现在 哪个 地 方 ?'，' 贵 州 '， 
' 云 南 '， "广西 '。' 福 建 '"，'A')") 

cursor.execute ("insert into exam (question, Answer A, Answer B, Answer C, 
Answer _D，right Answer) values(' 在 中 国 历史 上 是 谁 发 明了 麻药 '，' 孙 思 邀 '，' 华 伦 '， 
Ed) 

cursor.execute ("insert into exam (question, Answer A, Answer B, Answer C, 
Rnswer D，right Answer) values(' 京 剧 中 花旦 是 指 '，' 年 轻 男 子 ' ，' 年 轻 女子 '，' 年 长 男子 '， 
"年 长 女子 '，'B')") 

cursor.execute ("insert into exam (question, Answer A, Answer B, Answer C, 
Answer D，right Answer) values(' 篮 球 比赛 每 队 几 人 ? '，'4',，'5','6','7', 'B')") 
cursor.execute ("insert into exam (question, Answer A, Answer B, Answer C, 
Answer _D， right Answer) values (' 在 天 愿 作 比 翼 鸟 ， 在 地 愿 为 连理 枝 。 讲 述 的 是 谁 的 爱情 故事 ? '， 
' 焦 钟 狠 和 刘 兰 芝 ' ，' 梁 山 伯 与 祝 英 台 ' ，' 惟 营 营 和 张 生 ' ，' 杨 贵妃 和 唐 明 皇 '，'D') ") 


print (cursor.rowcount) # 通 过 rowcount 获得 插入 的 行 数 
cursor.close() 井 关 闭 Cursor 

conn .commit () 提交 事务 

conn .close () # 关 闭 Connection 


以 上 代码 完成 数据 库 test2.db 的 建立 。 下 面 实现 智力 问答 测试 程序 功能 。 


3.4.2 ” 读 取 试题 信息 


conn=sqlite3.connect ('test2.db') 
CuUrsor=conn .cursor () 

# 执 行 查询 语句 

cursor.execute('select * from exam') 
# 获 得 查询 结果 集 

values=cursor.fetchall () 
cursor.close() 

conn.close() 


以 上 代码 完成 数据 库 test2.db 的 试题 信息 的 读 取 ， 存 储 到 values 列表 中 。 


3.4.3 ”界面 和 逻辑 设计 


callNextO 用 于 判断 用 户 选择 的 正 误 ， 正 确 则 加 10 分 ， 错 误 不 加 分 ， 并 判断 用 户 是 否 
做 完 , 如 果 没 做 完 , 则 将 下 一 题 的 题目 信息 显示 到 timu 标签 ,4 个 选项 显示 到 radio1 一 radio4 
这 4 个 单 选 按钮 上 。 


import tkinter 
from tkinter import * 


from tkinter.messagebox import * 
def callNext (): 


global Kk 

global score 

useranswer=r .get () # 获 取 用 户 的 选择 

print (r.get ()) # 获 取 被 选中 单 选 按钮 变量 值 


if useranswer==values[k] [5] : 
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从 入 门 到 实战 一 一 爬虫 、 游 戏 和 机 器 学 习 
showinfo (" 恭 喜 "， "恭喜 你 对 了 ! ") 


score+=10 


else: 
showinfo ("遗憾 ", "遗憾 你 错 了 ! ") 
k=k+1 
if k>=len (values): # 判 断 用 户 是 否 做 完 
showinfo ("提示 ", "题目 做 完了 ") 
return 
# 显 示 下 一 题 
timu ["text"]=values[k] [0] # 题 目 信息 
radiol["text"]=values[k] [1] #A 选项 
radio2["text"]=values[k] [2] #B 选项 
radio3["text"]=values[k] [3] #C 选项 
radio4["text"]=values[k] [4] #D 选项 


he 


def callResult (): 
showinfo ("你 的 得 分 "，, str (score)) 
以 下 是 界面 布局 代码 ; 


root=tkinter.Tk() 
root .title('Python 智力 问答 游戏 ') 
root.geometry ("500x200") 


r=tkinter.stringVar() # 创 建 StringVar 对 象 
r.set('E') # 设 置 初始 值 为 'E'， 初 始 没 选中 
k=0 

score=0 

timu=tkinter.Label (root, text=values [k] [0] ) # 题 目 

timu.pack () 

f1=Frame (root) # 创 建 第 1 个 Frame 组 件 
fl.pack() 


radiol=tkinter.Radiobutton (fl1,variable=r,value='A', text=values [k] [1]) 
radiol .pack() 

radio2=tkinter.Radiobutton (fl1,variable=r,value='B', text=values [Kk] [2]) 
radio2.pack() 

radio3=tkinter.Radiobutton (fl1,variable=r,value='C', text=values [Kk] [3]) 
radio3.pack() 

radio4=tkinter.Radiobutton (f1,variable=r,value='D', text=values [k] [4]) 
radio4.pack() 

£2=Frame (root) # 创 建 第 2 个 Frame 组 件 

f2.pack() 

Button (f2, text=' 下 一 题 ', command=callNext) .pack (side=LEFT) 

Button (f2, text=' 结 果 ',command=callResult) .pack (side=LEFT) 


root .mainloop () 


4.1 小 小 翻译 器 功能 介绍 


小 小 翻译 器 使 用 百度 翻译 开放 平台 提供 的 API， 实 现 简单 的 翻译 功能 ， 用 户 输入 自己 
需要 翻译 的 单词 或 者 句子 ， 即 可 得 到 翻译 的 结果 ， 运 行 界面 如 图 4-1 所 示 。 该 翻译 器 不 仅 
能 够 将 英文 翻译 成 中 文 ， 也 可 以 将 中 文 翻译 成 英文 ， 或 者 是 其 他 语言 。 


图 4-1 小 小 翻译 器 的 运行 界面 


4.2 程序 设计 的 思路 


百度 翻译 开放 平台 提供 的 API， 可 以 为 用 户 提供 高 质量 的 翻译 服务 。 通 过 调用 百度 翻 
译 API 编写 在 线 翻 译 程序 。 

百度 翻译 开放 平台 每 月 提供 200 万 字符 的 免费 翻译 服务 ， 只 要 拥有 百度 账号 并 申请 成 
为 开发 者 就 可 以 获得 所 需要 的 账号 和 密码 。 下 面 是 开发 者 申请 链接 : 


| 鸭 要 项 目 案 


http://api.fanyi. 
为 方便 使 用 ， 
http://api.fanyi 
在 相应 文档 中 
按照 百度 翻译 
格式 的 翻译 结果 ， 


4.3 ”关键 技术 


例 开发 


从 入 门 到 实战 一 一 惟 虫 、 游 戏 和 机 器 学 习 


.baidu.com/api/trans/product/index 

百度 翻译 开放 平台 提供 了 详细 的 接 入 文档 ， 链 接 如 下 : 
.baidu.com/api/trans/product/apidoc 

列 出 了 详细 的 使 用 方法 。 

开放 平台 文档 中 的 要 求 , 生成 URL 请 求 网 页 , 提交 后 可 返回 JSON 数据 
再 将 得 到 的 JSON 格式 的 翻译 结果 解析 出 来 。 


4.3.1 urll 


urllib 是 Pytho 
文本 文件 一 样 读 取 


为 urllib; 在 Python3.x 中 ， 用 户 可 以 使 用 urllib 这 个 库 抓 取 网 页 。 


ib 库 简介 


n 标准 库 中 最 常用 的 Python 网 页 访问 的 模块 ， 它 可 以 让 用 户 像 访问 本 地 
网 页 的 内 容 。Python2 系列 使 用 的 是 urllib2，Python3 以 后 将 其 全 部 整合 


urllib 库 提 供 了 一 个 网 页 访问 的 简单 易 懂 的 API 接口 ， 还 包括 一 些 函数 方法 ， 用 于 进 


行 参数 编码 、 下 载 
读 取 或 者 保存 网 页 


(1) urllib.request 模块 : 用 来 打开 和 读 取 URL。 


网 页 等 操作 。 这 个 模块 的 使 用 门槛 非常 低 ， 初 学 者 也 可 以 尝试 去 抓 取 和 
。urllib 是 一 个 URL 处 理 包 ， 在 这 个 包 中 集合 了 一 些 处 理 URL 的 模块 。 


(2) urllib.error 模块 : 包含 一 些 由 urllib.request 产生 的 错误 ， 可 以 使 用 try 进行 捕捉 


处 理 。 


(3) urllib.parse 模块 : 包含 一 些 解析 URL 的 方法 。 
(4) urllib.robotparser 模块 : 用 来 解析 robots.txt 文本 文件 。 它 提供 了 一 个 单独 的 


RobotFileParser 类 ， 


4.3.2 urll 


下 面 结合 使 朋 


@ 获取 网 页 信息 


通过 该 类 提供 的 can_fetch0 方 法 测试 仆 虫 是 否 可 以 下 载 一 个 页 面 。 


ib 库 的 基本 使 用 


urllib request 和 urllib.parse 两 个 模块 说 明 urllib 库 的 使 用 方法 。 


使 用 urllibrequesturlopen(O) 函 数 可 以 很 轻松 地 打开 一 个 网 站 ， 读 取 并 打印 网 页 信息 。 
urlopen() 函 数 的 语法 格式 如 下 : 


urlopen(url[, data[, proxies]]) 


urlopen() 返 回 一 个 Response 对 象 , 然后 像 本 地 文件 一 样 操作 这 个 Response 对 象 来 获取 


远程 数据 。 其 中 ， 


参数 url 表示 远程 数据 的 路 径 ， 一 般 是 网 址 ， 参 数 data 表示 以 post 方式 


提交 到 URL 的 数据 (提交 数据 有 两 种 方式 一 一 post 与 get, 一 般 情况 下 很 少 用 到 这 个 参数 ); 


参数 proxies 用 于 


设置 代理 。urlopen0 还 有 一 些 可 选 参数 ， 对 于 具体 信息 ， 读 者 可 以 查阅 


Python 自 带 的 文档 。 
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urlopen0 返 回 的 Response 对 象 提供 了 如 下 方法 。 

e read()、readline()、readlines()、fileno()、closeO: 这 些 方法 的 使 用 方式 和 文件 对 象 完 
全 一 样 。 

。 info0: 返回 一 个 httplib.HTTPMessage 对 象 ， 表 示 远 程 服务 器 返回 的 头 信息 。 

getcode(): 返回 HTTP 状态 码 。 如 果 是 HTTP 请 求 ，200 表示 请 求 成 功 完成 ，404 表 

示 网 址 未 找到 。 

。 geturl(): 返回 请 求 的 URL。 

了 解 了 这 些 ， 读 者 就 可 以 编写 一 个 最 简单 的 爬 取 网 页 的 程序 。 

#urllib test0l.py 

from urllib import request 


if _ name ==" main _": 
response=request .urlopen ("http://fanyi.baidu.com") 
html=response.read() 
html=html .decode ("utf-8") #decode() 将 网 页 的 信息 进行 解码 ， 否 则 会 产生 乱码 
Print (html) 


urllib 使 用 requesturlopen0 打 开 和 读 取 URL 信息 , 返回 的 对 象 Response 如 同一 个 文本 
对 象 ， 用 户 可 以 调用 read(0) 进 行 读 取 ， 再 通过 printO 将 读 到 的 信息 打印 出 来 。 
运行 py 程序 文件 ， 输 出 信息 如 图 4-2 所 示 。 


Ele Edt Shel Debug OQptions Window Help 
TART: D:/python/ 取 虫 -001. py = 一 -= 


Shtnl> 


ne ta Dale= er ey en 
deeded ng Cement "maid 


ad> 
<meta charset="utf- 
‘<meta http-equiv= -| cometible” content="IE=-edge, chrome=1", 
er | 
i et es 支持 中 英 , 日 、 起 、 灰 、 法 、 西 ， 省 
Dr | 
| 


《Script》 
人 配置 需要 统计 | 


ndon. le i 


以 及 整体 的 扩 样 率 ， 不 需要 的 并 志 不 配置 即 可 (可 点 击 上 面 的 模块 名 称 自 动 隐藏 》 */ 

此 基础 上 进行 的 ) ，ht 网 页 必须 配置 ( 
WA Bt 在 红 的 抽样 是 在 ! , 基 行 的 再 抽样 ) ，https 协 议 的 网 页 必须 配置 ( 需 
: “158 ， 的 pr nn a 中 
区 We a a Es 
= 


图 4-2 读 取 的 百度 翻译 网 页 源码 


其 实 ， 这 就 是 浏览 器 接收 到 的 信息 ， 只 不 过 用 户 在 使 用 浏览 器 的 时 候 ， 浏 览 器 已 经 将 
这 些 信 息 转化 成 了 界面 信息 供用 户 浏览 。 浏 览 器 就 是 作为 客户 端 从 服务 器 端 获 取信 息 ， 然 
后 将 信息 解析 ， 再 展示 给 用 户 的 。 

这 里 通过 decode0 命 令 将 网 页 的 信息 进行 解码 : 


html=htm]l .decode ("utf-8") 


当然 , 这 个 前 提 是 用 户 已 经 知道 了 这 个 网 页 是 使 用 utf-8 编码 的 , 那么 怎么 查看 网 页 的 


hon 项 目 案例 开发 
从 入 门 到 实战 一 一 爬虫 、 游 戏 和 机 器 学 习 
编码 方式 呢 ? 非常 简单 的 方法 是 使 用 浏览 器 查看 网 页 源码 , 只 需要 找到 head 标签 开始 位 置 
的 chareset， 就 能 知道 网 页 是 采用 何 种 编码 了 。 

需要 说 明 的 是 ，urlopen() 函 数 中 的 url 参数 不 仅 可 以 是 一 个 字符 串 ， 例 如 "http:/www- 
baidu.com"， 还 可 以 是 一 个 Request 对 象 ， 这 就 需要 先 定义 一 个 Request 对 象 ， 然 后 将 这 个 
Request 对 象 作为 urlopen() 的 参数 使 用 ， 方 法 如 下 : 


req=request .Request ("http://fanyi.baidu.com/")  #Request 对 象 


response=request .urlopen (req) 

html=response.read() 

html=html .decode ("utf-8") 

print (html) 

注意 : 如 果 要 把 对 应 文件 下 载 到 本 地 ， 可 以 使 用 urlretrieveO 函 数 。 

from urllib import request 

request .urlretrieve ("http://www.zzti.edu.cn/ mediafile/index/2017/06/24 

/lqjdyc7ivgq5.jpg", "aaa.jpg") 

这 样 就 可 以 把 网 络 上 中 原 工 学 院 的 图 片 资源 1qjdyc7vq5.jpg 下 载 到 本 地 ， 生 成 aaa.jpg 
图 片 文 件 。 

@ 获取 服务 器 响应 信息 

和 浏览 器 的 交互 过 程 一 样 ，request'urlopen() 代 表 请 求 过 程 ， 它 返回 的 HTTPResponse 
对 象 代表 响应 。 返 回 内 容 作 为 一 个 对 象 更 便于 操作 ，HTTPResponse 对 象 的 status 属性 返回 
请 求 HITP 后 的 状态 ， 在 处 理 数据 之 前 要 先 判断 状态 情况 。 如 果 请 求 未 被 响应 ， 需 要 终止 
内 容 处 理 。reason 属性 非常 重要 ， 可 以 得 到 未 被 响应 的 原因 ，url 属性 用 于 返回 页 面 URL。 
HTTPResponse.read() 用 于 获取 请 求 的 页 面 内 容 的 二 进 制 形式 。 

用 户 也 可 以 使 用 getheaders() 返 回 HTTP 响应 的 头 信息 ， 例 如 : 


from urllib import request 


f=request .urlopen('http://fanyi.baidu.com') 
data=f. read() 
print('status:', f.status, f.reason) 
for k, v in f.getheaders(): 
print( ys: Ss % (er w)) 


可 以 看 到 HTTP 响应 的 头 信息 。 


Status: 200 OK 

Content-Type: text/html 

Date: Sat, 15 Jul 2017 02:18:26 GMT 

P3p: CP=" OTI DSP COR IVR OUR IND COM " 

Server: Apache 

Set-Cookie: locale=zh; expires=Fri, 11-May-2018 02:18:26 GMT; path=/; 
domain=.baidu.com 

Set-Cookie: BAIDUID=2335F4F896262887F5B2BCEAD460F5E9:FG=1; expires=Sun, 
15-Jul-18 02:18:26 GMT; max-age=31536000; path=/; domain=.baidu.com; 
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Version=1 
Vary: Accept-Encoding 
Connection: close 


Transfer-Encoding: chunked 


同样 可 以 使 用 Response 对 象 的 geturl0 方 法 、info0 方 法 、getcode0) 方 法 获取 相关 的 URL、 


响应 信息 和 响应 HTTP 状态 码 。 


#-*- coding: UTF-8 -# 一 

from urllib import request 

if _ name ==" main _": 
req=request .Request ("http://fanyi.baidu.com/") 
response=request .urlopen (req) 
print ("geturl 打印 信息 : $s"% (response.geturl ())) 


JPI 工 Di 七 ('* 闵 来 玉 六 率 水 六 水 水 水 率 六 闪闪 率 水 六 六 闪 冰 率 六 六 水 率 六 闪闪 率 冰冰 六 水 冰冰 六 冰冰 冰冰 永 ，) 


print ("info 打印 信息 : $s"% (response.info())) 
JP 工 Di 七 (' * 闵 水 六 六 六 率 六 闪 闵 率 率 六 六 水 水 率 六 六 水 率 六 六 水 率 率 水 兴 永 率 六 冰冰 冰冰 水 冰冰 冰冰 六 冰 


print ("getcode 打印 信息 : $s"% (response.getcode())) 
可 以 得 到 如 下 运行 结果 : 


geturl 打印 信息 : http://fanyi.baidu.com/ 

米 米 米 米 闵 米 米 冰冰 六 六 六 六 六 六 六 六 六 六 六 冰冰 六 冰冰 冰冰 六 六 六 六 冰冰 六 冰冰 冰冰 玉 冰 六 玉 冰 六 冰冰 

info 打印 信息 : Content-Type: text/html 

Date: Sat, 15 Jul 2017 02:42:32 GMT 

P3p: CP=" OTI DSP COR IVA OUR IND COM " 

Server: Apache 

Set-Cookie: locale=zh; expires=Fri, 11-May-2018 02:42:32 GMT; path=/; 
domain=.baidu.com 

Set-Cookie: BAIDUID=976A41D6BOC3FD6CA816A09BEAC3A89A:FG=1; expires=Sun, 
15-Jul-18 02:42:32 GMT; max-age=31536000; path=/; domain=.baidu.com; 
Version=1 

Vary: Accept-Encoding 

Connection: close 


Transfer-Encoding: chunked 
米 米 闵 米 六 米 六 六 六 六 六 六 六 六 六 六 六 玉 闵 米 闵 六 六 冰冰 六 六 六 六 六 六 六 冰冰 冰冰 冰冰 冰冰 六 冰冰 六 冰冰 


getcode 打印 信息 : 200 


现在 读者 已 经 学 会 了 使 用 简单 的 语句 对 网 页 进行 抓 取 ， 接 下 来 学 习 如 何 向 服务 器 发 送 


人 @ 向 服务 器 发 送 数据 
用 户 可 以 使 用 urlopen0) 函 数 中 的 data 参数 向 服务 器 发 送 数据 。 根 据 HTTP 规范 ，get 


F 信息 获 取 ，Ppost 是 向 服务 器 提交 数据 的 一 种 请 求 。 换 名 话说， 从 客户 端 向 服务 器 提交 


数据 使 用 post， 从 服务 器 获得 数据 到 客户 端 使 用 get。get 也 可 以 提交 ,与 post 的 区 别 如 下 : 


(1) get 方式 可 以 通过 URL 提交 数据 ， 待 提交 数据 是 URL 的 一 部 分 ; 采用 post 方式 ， 


待 提交 数据 放置 在 HIML header 内 。 
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(2) get 方式 提交 的 数据 最 多 不 超过 1024 个 字 节 , post 没有 对 提交 内 容 的 长 度 做 限制 。 

如 果 没 有 设置 urlopen0 函 数 的 data 参数 ，HTTP 请 求 采用 get 方式 ， 也 就 是 从 服务 器 
获取 信息 ;如果 设 置 data 参数 ，HTTP 请 求 采用 post 方式 ， 也 就 是 向 服务 器 传递 数据 。 

data 参数 有 自己 的 格式 ， 它 是 一 个 基于 application/x-www.form-urlencoded 的 格式 ， 对 
于 其 具体 格式 ， 读 者 不 用 了 解 ， 因 为 可 以 使 用 urllib.parse.urlencode() 函 数 将 字符 串 自动 转 
换 成 上 面 所 说 的 格式 。 

@ 使 用 User Agent 隐藏 身份 

1) 为 何 要 设置 User Agent 

有 些 网 站 不 喜欢 被 息 虫 程序 访问 ， 所 以 会 检测 连接 对 象 ， 如 果 是 候 虫 程序 ， 也 就 是 非 
人 点 击 访问 ， 它 就 会 不 让 继续 访问 ， 所 以 为 了 让 程序 可 以 正常 运行 ， 需 要 隐藏 自己 的 疏 虫 
程序 的 身份 。 此 时 可 以 通过 设置 User Agent 来 达到 隐藏 身份 的 目的 ，User Agent 的 中 文 名 
为 用 户 代理 ， 简 称 UA。 

User Agent 存放 于 headers 中 ， 服 务 器 就 是 通过 查看 headers 中 的 User Agent 来 判断 是 
谁 在 访问 。 在 Python 中 ， 如 果 不 设置 User Agent， 程 序 将 使 用 默认 的 参数 ， 那 么 这 个 User 
Agent 就 会 有 Python 的 字样 ， 如 果 服 务 器 检查 User Agent， 那 么 没有 设置 User Agent 的 
Python 程序 将 无 法 正常 访问 网 站 。 

了 Python 允许 用 户 修改 这 个 User Agent 来 模拟 浏览 器 访问 ， 它 的 强大 组 庸 置疑 。 

2) 常见 的 UserAgent 

(1) Android: 


*Mozilla/5.0 (Linux; Android 4.1.1; Nexus 7 Build/JRO03D) AppleWebKit/535.19 
(KHTML, like Gecko) Chrome/18.0.1025.166 Safari/535.19 

*Mozilla/5.0 (Linux; U; Android 4.0.4; en-gb; GT-I9300 Build/IMM76D) 
AppleWebKit/534.30 (KHTML, like Gecko) Version/4.0 Mobile Safari/534.30 
*Mozilla/5.0 (Linux; U; Android 2.2; en-gb; GT-P1000 Build/FROYO) 
AppleWebKit/533.1 (KHTML, like Gecko) Version/4.0 Mobile Safari/533.1 


(2) Firefox: 


*Mozilla/5.0 (Windows NT 6.2; WOW64; rv:21.0) Gecko/20100101 Firefox/21.0 
*Mozilla/5.0 (Android; Mobile; rv:14.0) Gecko/14.0 Firefox/14.0 


(3) Google Chrome: 


*Mozilla/5.0 (Windows NT 6.2; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) 
Chrome/27.0.1453.94 Safari/537.36 

*Mozilla/5.0 (Linux; Android 4.0.4; Galaxy Nexus Build/IMM76B) AppleWebKit/ 
535.19 (KHTML, like Gecko) Chrome/18.0.1025.133 Mobile Safari/535.19 


(4) iOSs: 


*Mozilla/5.0 (iPad; CPU 0S 5 0 like Mac OS X) AppleWebKit/534.46 (KHTML, like 
Gecko) Version/5.1 Mobile/9A334 Safari/7534.48.3 

*Mozilla/5.0 (iPod; U; CPU like Mac OS xX; en) AppleWebKit/420.1 (KHTML, like 
Gecko) Version/3.0 Mobile/3Al0la Safari/419.3 
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上 面 列举 了 Android、Firefox、Google Chrome、iOS 的 一 些 User Agent。 

3) 设置 User Agent 的 方法 

设置 User Agent 有 以 下 两 种 方法 : 

(1) 在 创建 Request 对 象 的 时 候 填 入 headers 参数 (包含 User Agent 信息 )， 这 个 
headers 参数 要 求 为 字典 。 

(2) 在 创建 Request 对 象 的 时 候 不 添加 headers 参数 ， 在 创建 完成 之 后 使 用 add_ 
header() 方 法 添加 headers。 

使 用 上 面 提 到 的 Android 的 第 1 个 User Agent, 在 创建 Request 对 象 的 时 候 传 入 headers 
参数 ， 编 写 代 码 如 下 : 


#-*— coding: UTF-8 —*-— 


from urllib import request 

if _ name ==" main _": 
# 以 CSDN 为 例 ，CSDN 不 更 改 User Agent 是 无 法 访问 的 
url='http://www.csdn.net/' 
head={} 
# 写 入 User Agent 信息 
head['User-Agent']='Mozilla/5.0 (Linux; Android 4.1.1; Nexus 7 Build/ 
JRO03D) AppleWebKit/535.19 (KHTML, like Gecko) Chrome/18.0.1025.166 
Safari/535.19"' 


req=request .Request (url, headers=head) # 创 建 Request 对 象 
response=request .urlopen (req) # 传 入 创建 好 的 Request 对 象 
html=response.read() .decode ('utf-8') # 读 取 响 应 信息 并 解码 
print (html) # 打 印信 息 

方法 三 


使 用 上 面 提 到 的 Android 的 第 1 个 User Agent， 在 创建 Request 对 象 时 不 传 入 headers 
参数 ， 在 创建 之 后 使 用 add_header() 方 法 添加 headers， 编 写 代 码 如 下 : 


#-*- coding: UTF-8 一 *# 一 


from urllib import request 

if _ name ==" _ main _": 
# 以 CSDN 为 例 ，CSDN 不 更 改 User Agent 是 无 法 访问 的 
url="'http://www.csdn.net/' 
req=request .Request (ur1l) # 创 建 Request 对 象 
req.adqd header('User-Agent', 'Mozilla/5.0 (Linux; Android 4.1.1; Nexus 
7 Build/JRO03D) AppleWebKit/535.19 (KHTML, like Gecko) Chrome/ 


18.0.1025.166 Safari/535.19') 井 传 入 headers 
response=request .urlopen (req) # 传 入 创建 好 的 Request 对 象 
html=response.read() .decode ('utf-8') 井 读 取 响 应 信息 并 解码 

print (html) # 打 印信 息 
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| we 项 目 案例 开发 


从 入 门 到 实战 一 一 爬虫 、 游 戏 和 机 器 学 习 


4.4 程序 设计 的 步 又 


4.4.1 设计 界面 


采用 Tkinter 的 place 几何 布局 管理 器 设计 GUI 图 形 界面 ， 运 行 


图 4-3 place 几何 布局 管理 器 


新 建文 件 translate testpy， 编 写 如 下 代码 : 


from tkinter import * 


if _ name ==" main _": 


root=TKk () 


root .title ("单词 翻译 器 ") 


root['width']=250;root['height']=130 


视频 讲解 


效果 如 图 4-3 所 示 。 


Label (root, text=' 输 入 要 翻译 的 内 容 : ' ,width=15) .place (x=1, y=1) 


Entryl=Entry 
Entryl.place 


(root, width=20) 
(x=110, y=1) 


s=StringVar () 
s.set ("大 家 好 ， 这 是 测试 ") 


Entry2=Entry (root, width=20, textvariable=s) 


Entry2.place 


Buttonl=Button (root, text=" 翻译 ' ,width=8) 


(x=110, y=20) 


Buttonl .Place (x=40, y=80) 


Button2=Button (root, text=' 清 空 ', width=8) 


Button2 .place (x=110, y=80) 
# 给 Button 绑 定 鼠 标 监听 事件 


Buttonl.bind("<Button-1>",1leftCclick) 
Button2.bind("<Button-1>", leftclick2) 


root .mainloop () 


4.4.2 ”使 用 百度 翻译 开放 平台 API 


使 用 百度 翻译 需要 向 “http://api.fanyi.baidu.com/api/trans/vip/translate ”地 址 通过 post 


或 get 方法 发 送 表 4-1 
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的 请 求 参数 来 访问 服务 。 


# 绝 对 坐标 (1，1) 
# 绝 对 坐标 (110，1) 
Label (root, text=' 翻 译 的 结果 : ' ,width=18) .place (x=1, y=20) # 绝 对 坐标 (1，20) 
# 一 个 StringVar () 对 象 
# 绝 对 坐标 (110，20) 

# 绝 对 坐标 (40，80) 

# 绝 对 坐标 (110，80) 


#“ 翻 译 ” 按 钮 
#“ 清 空 ”按钮 


第 4 音调 用 百度 API 应 用 一 小 小 翻译 器 
表 4-1 请 求 参数 
参 数 名 描 述 备 注 
q 请 求 翻译 query UTF-8 编码 
from 源 语言 语言 列表 〈 可 设置 为 auto) 
to 语言 列表 (不 可 设置 为 auto) 
appid 可 在 管理 控制 台 查 看 
salt 
sign appid+qt+salt+ 密 钥 的 md5 值 
sign 签名 是 为 了 保证 调用 安全 ,使 用 mds 算法 生成 的 一 段 字符 串 ， 生 成 的 签名 长 度 为 


32 位 ， 签 名 中 的 英文 字符 均 为 小 写 格式 。 为 保证 翻译 质量 ， 请 将 单 次 请 求 长 度 控制 在 6000 


字 节 以 内 〈 汉 字 约 为 2000 个 )。 
签名 的 生成 方法 如 下 : 


(1) 将 请 求 参数 中 的 appid、query (q， 注 意 为 UTF-8 编码 )、 随 机 数 salt 以 及 平台 分 


配 的 密 钥 〈 可 在 管理 控制 台 查 看 ) 按照 appid+qtsalt+ 密 钥 的 顺序 拼接 得 到 字符 吓 
(2) 对 字符 串 1 做 md5， 得 到 32 位 小 写 的 sign。 
注意 : 
(1) 先 将 需要 翻译 的 文本 转换 为 UTF-8 编码 。 
(2) 在 发 送 HTTP 请 求 之 前 需要 对 各 字段 做 URL encode。 


Bl。 


(3 ) 在 生成 签名 拼接 字符 串 时 ，q 不 需要 做 URL encode， 在 生成 签名 之 后 发 送 HITP 


请 求 之 前 才 需 要 对 要 发 送 的 待 翻 译文 本 字段 q 做 URL encode。 


例如 将 apple 从 英文 翻译 成 中 文 。 
请 求 参数 : 

qrapple 

from=en 

to=zh 
appid=2015063000000001 
salt=1435660288 
平台 分 配 的 密 钥 : 12345678 


生成 签名 参数 sign: 

(1) 拼接 字符 串 1。 

拼接 appid=2015063000000001+q=apple+salt=1435660288+ 密 钥 =12345678 

得 到 字符 串 1=2015063000000001apple143566028812345678 

(2) 计算 签名 sign( 对 字符 串 1 做 md5 加 密 ,， 注意 在 计算 md5 之 前 ,字符 绰 
UTF-8 编码 )。 


sign=md5 (2015063000000001apple143566028812345678) 
sign=f89f9594663708c1605f3d736d01d2d4 


通过 Python 提供 的 hashlib 模块 中 的 hashlib.md5() 可 以 实现 签名 计算 。 例 如 


和 1 必须 为 
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import hashlib 
m="2015063000000001apple143566028812345678 


m MD5=hashlib.md5 (m) 


从 入 门 到 实战 一 一 疏 虫 、 游 戏 和 机 器 学 习 


sign=m MD5.hexqdigest () 


print( "m='vm) 


print ('sign="',sign) 


在 得 到 签名 之 后 ， 按 照 百度 文档 中 的 要 求生 成 URL 请 求 ， 提 交 后 可 返 


其 完整 请 求 如 下 : 


互 


翻译 结果 。 


http://api.fanyi.baidu.com/api/trans/vip/translate?q=apple&from=en&to=zh&appid=201506 
3000000001&salt=1435660288&sign=f89f9594663708c1605f3d736d01d2d4 


用 户 也 可 以 使 有 


post 方法 传送 需要 的 参数 。 


本 例 采 用 urllib requesturlopen() 函 数 中 的 data 参数 向 服务 器 发 送 数据 。 
下 面 是 发 送 data 的 实例 ， 向 “百度 翻译 ”发 送 要 翻译 数据 data， 得 到 翻译 结果 。 


#-*— coding: UTF-8 一 # 一 
from tkinter import * 


from urllib import request 


from urllib import parse 


import json 


import hashlib 
def translate Word(en str): 


#simulation browse load host url,get cookie 


URL="'http://api.fanyi.baidu.com/api/trans/vip/translate'"' 
#en_str=input ("请 输入 要 翻译 的 内 容 :") 

# 创 建 Form Data 字典 ， 存 储 向 服务 器 发 送 的 data 

#Form Data={'from' :en' "to':'zh'v'q':en str,"appid": 
'2015063000000001','salt':'1435660288"'} 

Form Data={} 


Form Data 
Form Data 
Form Data 
Form Data 
Form Data 


rom = en 
Ten wa 
'q']=en str # 要 翻译 数据 


"appid']='2015063000000001'  ## 申 请 的 APP ID 


这 于 


Key="12345678" 
m=Form Data['appid']+en str+Form Data['salt']+Key 
m MD5=hashlib.md5 (m.encode ('utf8°')) 


Form Data 


'sign"' 


='1435660288' 
# 平 台 分 配 的 密 钥 


=m MD5.hexdigest () 


data=parse.urlencode (Form Data) .encode ('utf-8') 


# 使 用 urlencode () 方 法 转换 标准 格式 


response=request .urlopen (URL, data) # 传 递 Request 对 象 和 转换 完 格式 的 数据 
html=response.read() .decode ('utf-8') ## 读 取信 息 并 解码 
translate results=j son.1loads (html) 才 使 用 JSON 


第 4 章 调用 百度 API 应 用 一 一 小 小 翻译 器 
print (translate results) # 打 印 出 JSON 数据 
translate results=translate results['trans result"'] [0]['dst'] 

# 找 到 翻译 结果 


print ("翻译 的 结果 是 : $s" 名 translate results) # 打 印 翻译 信息 
return translate results 

def leftClick (event): # “翻译” 按钮 事件 函数 
en str=Entryl.get() # 获 取 要 翻译 的 内 容 
print (en str) 
vText=translate Word(en str) 


Entry2.config (Entry2, text=vText) # 修 改 翻 译 结果 框 文字 
Se 
Entry2.insert (0,vText) 

def leftCclick2 (event): # “清空 ”按钮 事件 函数 
S80E 


Entry2.insert (0,"") 
这 样 就 可 以 查看 翻译 的 结果 了 ， 如 下 : 


输入 要 翻译 的 内 容 : I am a teacher 
翻译 的 结果 是 : 我 是 个 教师 。 


此 时 得 到 的 JSON 数据 如 下 : 


{Erom :ener bo zh ranseresnlt, 1 ast "是 个 未 炳 Usrew: 
'I am a teacher'}]} 


其 返回 结果 是 JSON 格式 ， 包 含 表 4-2 中 的 字段 。 
表 4-2 ”翻译 结果 的 JSON 字段 


翻译 源 语 言 
TEXT 
TEXT 


翻译 结果 
| ITExr | 
| Wr | 
trans_result 中 包含 了 src 和 dst 字段 。 
JSON 是 一 种 轻 量 级 的 数据 交换 格式 ， 其 中 保存 了 用 户 想 要 的 翻译 结果 ， 需 要 从 有 息 取 


到 的 内 容 中 找到 JSON 格式 的 数据 ， 再 将 得 到 的 JSON 格式 的 翻译 结果 解析 出 来 。 
这 里 向 服务 器 发 送 数据 Form_Data 也 可 以 直接 如 下 写 : 


Form Data={'from':'en', 'to':'zh', 'q':en str,"appid": 
'2015063000000001', "salt': '1435660288"'} 


现在 只 是 将 英文 翻译 成 中 文 ， 稍 微 改 一 下 就 可 以 将 中 文 翻译 成 英文 了 : 


Form Data={'from':'zh', 'to':'en', 'q':en str,''appid'': 
'2015063000000001', "salt': '1435660288"'} 


这 一 行 中 的 fom 和 to 的 取 值 应 该 可 以 用 于 其 他 语言 之 间 的 翻译 。 如 果 源 语言 语种 不 
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| 项 目 案例 开发 


从 入 门 到 实战 一 一 怜 虫 、 游 戏 和 机 器 学 习 


确定 可 设置 为 auto, 注意 目标 语言 语种 不 可 设置 为 auto。 百度 翻译 支持 的 语言 简写 如 表 4-3 


所 示 。 
表 4-3 3 

语言 简写 名 称 名 称 
auto 自动 检测 保加利亚 语 
zh 中 文 爱沙尼亚 语 
en 英语 丹麦 语 
yue 粤语 芬兰 语 
WyW, 3 捷克 语 
Pp 日 语 罗马 尼 亚 语 
kor 韩语 斯 洛 文 尼 亚 语 
fra 法 语 瑞典 语 
spa 西班牙 语 匈牙利 语 
也 泰语 繁体 中 文 
ara 阿拉 伯 语 越南 语 
m 俄语 | aq | 项 腊 语 
pt 葡萄 牙 语 荷兰 语 
de 德语 | pm | 兰 语 


请 读者 查阅 资料 编程 ， 向 有 道 翻译 (http://fanyi.youdao.com/translate?smartresult=dict) 


发 送 要 翻译 数据 data， 得 到 翻译 结果 


5.1 校园 网 搜索 引擎 功能 分 析 


随 着 校园 网 建设 的 迅速 发 展 ， 校 园 网 内 的 信息 内 容 正在 以 惊人 的 速度 
增加 着 。 如 何 更 全 面 、 更 准确 地 获取 最 新 、 最 有 效 的 信息 已 经 成 为 人 们 把 握 机 遇 、 迎 接 挑 
战 和 获取 成 功 的 重要 条 件 。 目 前 虽然 已 经 有 了 像 Google、 百 度 这 样 优秀 的 通用 搜索 引擎 ， 
但 是 它们 并 不 能 适用 于 所 有 的 情况 和 需要 。 对 学 术 搜索 、 校 园 网 的 搜索 来 说 ， 一 个 合理 的 
排序 结果 是 非常 重要 的 。 另 外 ， 互 联网 上 的 信息 量 巨大 ， 远 远 超 出 哪怕 是 最 大 的 一 个 搜索 
引擎 可 以 完全 收集 的 能 力 范围 。 本 章 旨 在 使 用 Python 建立 一 个 适合 校园 网 使 用 的 Web 搜 
索引 擎 系统 ， 它 能 在 较 短 的 时 间 内 怜 取 页 面 信息 ， 具 有 有 效 、 准 确 的 中 文 分 词 功能 ， 能 实 
现 对 校园 网 上 新 闻 信 息 的 快速 检索 展示 。 


5.2 ”校园 网 搜索 引擎 系统 设计 


校园 网 搜索 引擎 一 般 需 要 以 下 几 个 步骤 ; 

(1) 网 络 朴 虫 疏 取 这 个 网 站 ， 得 到 所 有 网 页 链接 。 

网 络 疏 虫 就 是 一 只 会 嗅 着 URL 链接) 疏 过 成 千 上 万 个 网 页 ， 并 把 网 页 内 容 搬 到 用 户 
计算 机 上 供用 户 使 用 的 苦力 虫子 。 如 图 5-1 所 示 ， 给 定 仆 虫 的 出 发 页 面 A 的 URL， 它 就 从 
起 始 页 A 出 发 ， 读 取 A 的 所 有 内 容 ， 并 从 中 找到 5 个 URL， 分 别 指向 页 面 B、C、D、E 
和 下 ， 然 后 它 顺 着 链接 依次 抓 取 B、C、D、E 和 下 页 面 的 内 容 ， 并 从 中 发 现 新 的 链接 ， 再 
沿 着 链接 疏 到 新 的 页 面 ， 对 疏 虫 带 回来 的 网 页 内 容 分 析 链 接 ， 继 续 爬 到 新 的 页 面 ， 以 此 类 
推 ， 直 到 找 不 到 新 的 链接 或 者 满足 了 人 为 设 定 的 停止 条 件 为 止 。 

至 于 这 只 虫子 前 进 的 方式 ， 则 分 为 广度 优先 搜索 (BFS) 和 深度 优先 搜索 (DFS)。 在 
这 张 图 中 BFS 的 搜索 顺序 是 A-B-C-D-E-F-G-H-I， 而 深度 优先 搜索 的 顺序 是 遍历 的 路 径 ， 
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从 入 门 到 实战 一 一 怜 虫 、 游 戏 和 机 器 学 习 
即 A-F-G E-H-I BCD。 


图 5-1 网 站 链接 示意 图 


(2) 得 到 网 页 的 源 代码 ， 解 析 剥 离 出 想 要 的 新 闻 内 容 、 标 题 、 作 者 等 信息 。 
(3) 把 所 有 网 页 的 新 闻 内 容 做 成 词 条 索引 ， 


索引 一 般 有 正 排 
。 正 排 索引 〈 正 向 索引 ， 


息 直 到 找 出 所 有 包含 查询 关键 字 的 文档 。 


正 排 表 的 结构 如 图 
较 方 便 且 易于 维护 ; 
立 一 个 新 的 索引 块 ， 挂 接 在 原来 索引 文件 的 后 
文档 对 应 的 索引 信息 ， 将 其 直 


保 没有 遗漏 ， 这 样 就 使 得 检索 


文档 1 


一 般 采 用 倒 排 表 索 引 。 


索引 〔 正 向 索引 ) 和 倒 排 索引 《〈 反 向 索引 ) 两 种 类 型 。 
forward index): 正 排 表 是 以 文档 的 ID 为 关键 字 ， 表 中 记录 
文档 ( 即 网 页 ) 中 每 个 字 或 词 的 位 置信 息 ， 


查找 时 扫描 表 中 每 个 文档 中 字 或 词 的 信 


5-2 所 示 ， 这 种 组 织 方法 在 建立 索引 的 时 候 结构 比较 简单 ， 建 立 比 
因为 索引 是 基于 文档 建立 的 ， 若 是 有 新 的 文档 加 入 ， 直 接 为 该 文档 建 


H] 


。 若 是 有 文档 删除 ， 则 直接 找到 该 文档 号 


接 删除 。 但 是 在 查询 的 时 候 震 要 对 所 有 的 文档 进行 扫 撕 以 确 
时 间 大 大 延长 ， 检 索 效 率 低下 。 


厂 =。 单词 2 


单词 | 单词 2 


图 5-2 正 排 表 结构 示意 图 


尽管 正 排 表 的 工作 原理 非常 简单 ， 但 是 由 于 其 检索 效率 太 低 ， 除 非 在 特定 情况 下 ， 否 


则 实用 价值 不 大 。 


。 倒 排 索引 《〈 反 向 索引 ，inverted index): 倒 排 表 以 字 或 词 为 关键 字 进行 索引 ， 表 中 关 


键 字 所 对 应 的 记录 表 项 记录 了 出 现 这 个 字 或 词 的 所 有 文档 ， 一 个 表 项 就 是 一 
它 记 录 该 文档 的 ID 和 字符 在 该 文档 中 出 现 的 位 置 情况 。 
1 于 每 个 字 或 词 对 应 的 文档 数量 在 动态 变化 ， 所 以 倒 排 表 的 建立 和 维护 都 较为 复杂 ， 


段 ， 


个 守 才 


但 是 在 查询 的 时 候 由 于 可 以 一 次 得 到 查询 关键 字 所 对 应 的 所 有 文档 ,所 以 效率 高 于 正 排 表 。 
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在 全 文 检索 中 ， 检 索 的 快速 响应 是 一 个 最 为 关键 的 性 能 ， 而 索引 的 建立 由 于 在 后 台 进 行 ， 
尽管 效率 相对 低 一 些 ， 但 不 会 影响 整个 搜索 引擎 的 效率 。 
倒 排 表 的 结构 如 图 5-3 所 示 。 


单词 1 | 文档 二 文档 2 = 


单词 1 让 档 1 上 文 机 上 S| 


图 5-3 倒 排 表 结 构 示 意图 


正 排 索引 是 从 文档 到 关键 字 的 映射 〈 已 知 文档 求 关 键 字 )， 倒 排 索引 是 从 关键 字 到 文 
档 的 映射 〈 已 知 关键 字 求 文档 )。 

在 搜索 引擎 中 每 个 文件 都 对 应 一 个 文件 ID， 文 件 内 容 被 表示 为 一 系列 关键 词 的 集合 
(实际 上 ， 在 搜索 引擎 索引 库 中 关键 词 已 经 转换 为 关键 词 ID )。 例 如 “文档 1” 经 过 分 词 提 
取 了 20 个 关键 词 , 每 个 关键 词 都 会 记录 它 在 文档 中 的 出 现 次 数 和 出 现 位 置 , 得 到 正 向 索引 
的 结构 如 下 : 

“文档 1” 的 ID > 单词 1: 出 现 次 数 ， 出 现 位 置 列表 ， 单 词 2， 出现 次 数 ， 出 现 位 置 列 表 ，…… 

“文档 2” 的 ID > 此 文档 出 现 的 关键 词 列表 


当 用 户 搜索 关键 词 “ 华 为 手机 ”时 ， 假 设 只 存在 正 向 索引 (forward index)， 那 么 就 需 
要 扫描 索引 库 中 的 所 有 文档 ， 找 出 所 有 包含 关键 词 “ 华 为 手机 ”的 文档 ， 再 根据 打分 模型 
进行 打分 ， 排 出 名 次 后 呈现 给 用 户 。 因 为 互联 网 上 收录 在 搜索 引擎 中 的 文档 的 数目 是 个 天 
文 数字 ， 这 样 的 索引 结构 根本 无 法 满足 实时 返回 排名 结果 的 要 求 。 所 以 搜索 引擎 会 将 正身 
索引 重新 构建 为 倒 排 索引 ， 即 把 文件 ID 对 应 到 关键 词 的 映射 转换 为 关键 词 到 文件 ID 的 映 
射 ， 每 个 关键 词 都 对 应 一 系列 的 文件 ， 这 些 文件 中 都 出 现 这 个 关键 词 ， 得 到 倒 排 索引 的 结 
构 如 下 : 

“单词 1”:“ 文 档 1” 的 ID,“ 文 档 2” 的 ID，…… 

“单词 2”: 带 有 此 关键 词 的 文档 ID 列表 


(4) 搜索 时 ， 根 据 搜索 词 在 词 条 索引 中 查询 ， 按 顺序 返回 相关 的 搜索 结果 ， 也 可 以 按 
网 页 评价 排名 顺序 返回 相关 的 搜索 结果 。 

当 用 户 输入 一 串 搜索 字符 串 时 ， 程 序 会 先进 行 分 词 ， 然 后 依照 每 个 词 的 索引 找到 相应 
网 页 。 假 如 在 搜索 框 中 输入 “从 前 有 座 山 山里 有 座 庙 小 和 尚 ”搜索 引擎 首先 会 对 字符 串 进 
行 分 词 处 理 “ 从 前 /有 / 座 山 /山里 /有 / 座 庙 /小 和 尚 ”"， 然 后 按照 一 定 的 规则 对 词 做 布尔 运算 ， 
例如 每 个 词 之 间 做 “与 ”运算 ， 在 索引 中 搜索 “同时 ”包含 这 些 词 的 页 面 。 

所 以 本 系统 主要 由 以 下 4 个 模块 组 成 。 

。 信息 采集 模块 : 主要 是 利用 网 络 爬 虫 实现 对 校园 网 信息 的 抓 取 。 

。 索引 模块 : 负责 对 爬 取 的 新 闻 网 页 的 标题 、 内 容 和 作者 进行 分 词 并 建立 倒 排 词 表 。 
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。 网 页 排名 模块 : TF/IDF 是 一 种 统计 方法 , 用 于 评估 一 字 词 对 于 一 个 文件 集 或 一 个 语 
料 库 中 的 一 份 文件 的 重要 程度 。 


用 户 搜索 界面 模块 : 负责 用 户 关键 字 的 输入 以 及 搜索 结果 信息 的 返 


五 
o 


5.3 关键 技术 


5.3.1 


把 


去 


正则 表达 式 


页 中 的 超 链接 提取 出 来 需要 使 用 正则 表达 式 。 那 么 什么 是 正则 表达 式 ? 在 回答 这 


个 问题 之 前 先 来 看 一 看 为 什么 要 有 正则 表达 式 。 

在 编程 处 理 文 本 的 过 程 中 ， 经 常 需要 按照 某 种 规则 去 查找 一 些 特定 的 字符 串 。 例 如 知 
道 一 个 网 页 上 的 图 片 都 叫 “image/8554278135.jpg” 之 类 的 名 字 ， 只 是 那 串 数字 不 一 样 ， 又 
或 者 在 一 堆 人 员 的 电子 档案 中 ， 要 把 他 们 的 电话 号 码 全 部 找 出 来 ， 整 理 成 通讯 录 。 诸 如 此 
类 工作 ， 可 不 可 以 利用 这 些 规律 ， 让 程序 自动 来 做 这 些 事情 ? 答案 是 肯定 的 。 这 时 候 就 需 
要 一 种 描述 这 些 规律 的 方法 ， 正 则 表达 式 就 是 描述 文本 规则 的 代码 。 


T 


是 不 合法 的 。 


@ 正则 表达 式 的 语法 
正则 表达 式 并 不 是 Python 中 特有 的 功能 ， 它 是 一 种 通用 的 方法 ， 要 使 用 它 必须 会 用 正 


正则 表达 式 是 一 种 用 来 匹配 字符 串 文本 的 强 有 力 的 武器 。 它 是 用 一 种 描述 性 的 语言 来 
给 字符 串 定义 一 个 规则 。 凡 是 符合 规则 的 字符 串 ， 就 认为 它 “ 匹 配 ” 了 ， 否 则 该 字符 串 就 


则 表达 式 来 描述 文本 规则 。 
正则 表达 式 使 用 特殊 的 语法 来 表示 ， 表 5-1 列 出 了 正则 表达 式 的 语法 。 


表 5-1 正则 表达 式 的 语法 


模 式 描 述 
的 匹配 字符 串 的 开头 
$ 匹配 字符 串 的 末尾 
匹配 任意 字符 ， 除 了 换行 符 
Ed 用 来 表示 一 组 字符 ， 例 如 [amkj 匹 配 'a、'' 或 发 ，[0-9] 匹 配 任何 数字 ， 类 似 于 
袜 [0123456789]，[a-z] 匹 配 任何 小 写字 母 ，[a-zA-Z0-9] 匹 配 任何 字母 及 数字 
[2.] 不 在 0] 中 的 字符 ， 例 如 [^abc] 匹 配 除 了 a、b、se 之 外 的 字符 ，[^0-9] 匹 配 除了 数字 之 
2 外 的 字符 
数量 词 ， 匹 配 0 个 或 多 个 
十 数量 词 ， 匹 配 1 个 或 多 个 
数量 词 ， 以 非 贫 禁 方式 匹配 0 个 或 1 个 
{n,} 重复 n 次 或 更 多 次 
{n,m} 重复 n 一 m 次 
alb 匹配 a 或 b 
(re) 匹配 括号 内 的 表达 式 ， 也 表示 一 个 组 
?imx) 正则 表达 式 包含 3 种 可 选 标志 ， 即 i、m、x， 只 影响 括号 中 的 区 域 
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模 式 描 述 

(?-imx) 正则 表达 式 关 闭 i、m 或 x 可 选 标志 ， 只 影响 括号 中 的 区 域 

(2:re) 类 似 (…)， 但 是 不 表示 一 个 组 

(Cimx: re) 在 括号 中 使 用 i、m 或 x 可 选 标志 

(?-imx: re) 在 括号 中 不 使 用 i、m 或 x 可 选 标志 
前 向 肯定 界定 符 ， 如 果 所 含 正 则 表达 式 以 ... 表 示 , 在 当前 位 置 成 功 匹 配 时 成 功 , 否 

(2=re) 则 失败 。 一 旦 所 含 表 达 式 已 经 尝试 ,匹配 引擎 根本 没有 提高 ， 模 式 的 剩余 部 分 还 要 
尝试 界定 符 的 右边 

a 前 向 否定 界定 符 , 与 前 面 肯定 界定 符 相 反 , 当 所 含 表 达 式 不 能 在 字符 串 当前 位 置 匹 

Ce 配 时 成 功 

(2> re) 匹配 的 独立 模式 ， 省 去 回溯 

\w 匹配 字母 、 数 字 及 下 画 线 ， 等 价 于 '[A-Za-z0-9 

\W 匹配 非 字 母 、 数 字 及 下 夯 线 ， 等 价 于 '[^A-Za-z0-9_] 

\s 匹配 任何 空白 字符 ， 包 括 空 格 、 制 表 符 、 换 页 符 等 ， 等 价 于 [ \fn\n\t\v] 

\S 匹配 任何 字符 ， 等 价 于 [^ \fawtvv] 

\d 匹配 任意 数字 ， 等 价 于 [0-9] 

D 匹配 任意 非 数 字 ， 等 价 于 [^0-9] 

\A 匹配 字符 串 开 始 

Zz 匹配 字符 串 结束 ， 如 果 存在 换行 ， 只 匹配 到 换行 前 的 结束 字符 串 

\z 匹配 字符 串 结束 

\G 匹配 最 后 匹配 完成 的 位 置 

wb 匹配 一 个 单词 边界 ， 也 就 是 单词 和 空格 间 的 位 置 。 例 如 ，'erb' 可 以 匹配 "never" 中 的 
'er'， 但 不 能 匹配 "verb" 中 的 'er' 

B 匹配 非 单词 边界 ， 例 如 'erB" 能 匹配 "verb" 中 的 'er， 但 不 能 匹配 "never" 中 的 'er 

tn、\t 等 匹配 一 个 换行 符 、 一 个 制 表 符 等 


正则 表达 式 通 常用 于 在 文本 中 查找 匹配 的 字符 串 。 在 Python 中 数量 词 默 认 是 贪 禁 的 ， 


总 是 尝试 匹配 尽 可 能 多 的 字符 ;， 非 贪 禁 的 则 相反 ， 总 是 尝试 匹配 尽 可 能 少 的 字符 。 例 如 ， 
正则 表达 式 "ab*" 如 果 用 于 查找 "abbbc"， 将 找到 "abbb"; 如 果 使 用 非 贪 禁 的 数量 词 "ab*?"， 


将 找到 "a"。 


在 正则 表达 式 中 ， 如 果 直 接 给 出 字符 ， 就 是 精确 匹配 。 从 正则 表达 式 语 法 中 能 够 了 解 


到 用 \d 可 以 匹配 一 个 数字 ， 用 \w 可 以 匹配 一 个 字母 或 数字 ， 用 .可 以 匹配 任意 字符 ， 所 以 模 


式 '00\' 可 以 匹配 '007'"， 但 无 法 匹配 '00A';， 模式 \d\d\d' 可 以 匹配 '010'"， 模 式 \wiww\d' 可 以 匹配 


'py3'; 模式 'py.' 可 以 匹配 ipyc'、'pyo'、'py!'， 等 等 。 


如 果 要 匹配 变 长 的 字符 , 在 正则 表达 式 模式 字符 串 中 用 * 表 示 任 意 个 字符 (包括 0 个 )， 


+ 表示 至 少 
个 字符 。 这 本 


个 字符 , 用 ?表示 0 个 或 1 个 字符 , 用 {nm} 表示 nn 个 字符 , 用 {n,m} 表 示 n~m 
看 一 个 复杂 的 表示 电话 号 码 的 例子 ， 即 vd{3}\stvd{13.8}。 


从 左 到 右 解读 一 下 : 

\d{3} 表 示 匹 配 3 个 数字 ， 例 如 '010'; 

\s 可 以 匹配 一 个 空格 (也 包括 Tab 等 空白 符 )， 所 以 \s+ 表 示 至 少 有 一 个 空格 ; 
\d{3,8} 表 示 3 一 8 个 数字 ， 例 如 '67665230'。 

综合 起 来 ， 上 面 的 正则 表达 式 可 以 匹配 以 任意 个 空格 隔 开 的 带 区 号 的 电话 号 码 。 
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如 果 要 匹配 '010-67665230' 这 样 的 号 码 ， 怎 么 办 ? 由 于 '-'. 是 特殊 字符 ， 在 正则 表达 式 中 
要 用 内 转 义 ， 所 以 上 面 的 正则 表达 式 是 \d{3}\-\d{3.8} 。 

如 果 要 做 更 精确 的 匹配 ， 可 以 用 [] 表 示范 围 ， 例 如 : 

[0-9a-zA-Z\_] 可 以 匹配 一 个 数字 、 字 母 或 者 下 画 线 ; 

[0-9a-zA- 妈 1+ 可 以 匹配 至 少 由 一 个 数字 、 字 母 或 者 下 画 线 组 成 的 字符 串 ， 例 如 'a100'、 
'0_Z'、'Py3000' 等 ; 

[a-zA-Z\][0-9a-zA-Z\ ]* 可 以 匹配 以 字母 或 下 画 线 开头 ， 后 接任 意 个 由 一 个 数字 、 字 
母 或 者 下 画 线 组 成 的 字符 串 ， 也 就 是 Python 合法 的 变量 ; 

[a-zA-Z\ ][0-9a-zA-Z\ ]{0, 19} 更 精确 地 限制 了 变量 的 长 度 是 1 一 20 个 字符 (前 面 1 个 
字符 + 后 面 最 多 19 个 字符 )。 

另外 ，AB 可 以 匹配 A 或 B， 所 以 (Plp)ython 可 以 匹配 "Python' 或 者 python'。 

^ 表 示 行 的 开头 ，A\d 表示 必须 以 数字 开头 。 

$ 表 示 行 的 结束 ，\d$ 表 示 必 须 以 数字 结束 。 

@ re 模块 

Python 提供 了 re 模块 ， 包 含 所 有 正则 表达 式 的 功能 。 

1) match() 方 法 

re.match() 的 格式 为 re.match(pattern, string, flags)。 
其 第 1 个 参数 是 正则 表达 式 , 第 2 个 参数 表示 要 匹配 的 字符 串 ; 第 3 个 参数 是 标志 位 ， 
于 控制 正则 表达 式 的 匹配 方式 ， 例 如 是 否 区 分 大 小 写 、 多 行 匹配 等 。 

match() 方 法 判断 是 否 匹 配 ， 如 果 匹 配 成 功 ， 返 回 一 个 Match 对 象 ， 和 否则 返回 None。 

常见 的 判断 方法 如 下 : 

test=' 用 户 输入 的 字符 串 ' 


if re.match(r' 正 则 表达 式 '，test): ” #r 前缀 为 原 义 字符 串 ， 它 表示 对 字符 串 不 进行 转 义 
EnEKOK 


else: 

print ('failed') 
例如 : 
>>> import re 
>>> re.match(r'^\d{3}\-\d{3,8}$'，"'010-12345') # 返 回 一 个 Match 对 象 
< sre.SRE Match object; span=(0,9), match="'010-12345'> 
>>> rematcH(re NAIIN= NAL37839 "OL0" 12345™) 

# "010 12345' 不 匹配 规则 ， 返 回 None 


Match 对 象 是 一 次 匹配 的 结果 ， 包 含 了 很 多 关于 此 次 匹配 的 信息 ， 可 以 使 用 Match 提 
供 的 可 读 属性 或 方法 来 获取 这 些 信息 。 

Match 属性 如 下 : 

。 string: 匹配 时 使 用 的 文本 。 

。 re: 匹配 时 使 用 的 Pattern 对 象 。 

。 pos: 文本 中 正则 表达 式 开始 搜索 的 索引 , 值 与 Pattern.match() 和 Pattern.search() 方 法 
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的 同名 参数 相同 。 
。 endpos: 文本 中 正则 表达 式 结束 搜索 的 索引 ， 值 与 Pattern.match0 和 Pattern.search() 
方法 的 同名 参数 相同 。 
。 lastindex: 最 后 一 个 被 捕获 的 分 组 在 文本 中 的 索引 。 如 果 没 有 被 捕获 的 分 组 ， 将 为 
None。 
。 lastgroup: 最 后 一 个 被 捕获 的 分 组 的 别名 。 如 果 这 个 分 组 没有 别名 或 者 没有 被 捕获 
的 分 组 ， 将 为 None。 
Match 方法 如 下 : 
。 group([group1, ...]): 获得 一 个 或 多 个 分 组 截获 的 字符 串 ， 当 指定 多 个 参数 时 将 以 元 
组 形式 返回 。 参 数 groupl 可 以 使 用 编号 也 可 以 使 用 别名 ; 编号 0 代表 整个 匹配 的 子 
串 ; 当 不 填写 参数 时 返回 group(0); 没有 截获 字符 串 的 组 返回 None; 截获 了 多 次 的 
组 返回 最 后 一 次 截获 的 子 串 。 
groups([default]): 以 元 组 形式 返回 全 部 分 组 截获 的 字符 串 , 相当 于 调用 group(1.2,….， 
last)。default 表示 没有 截获 字符 串 的 组 以 这 个 值 蔡 代 ， 默 认为 None。 
groupdict([default]): 返回 以 有 别名 的 组 的 别名 为 键 、 以 该 组 截获 的 子 串 为 值 的 字典 ， 
没有 别名 的 组 不 包含 在 内 。default 的 含义 同上 。 
start([group]): 返回 指定 的 组 截获 的 子 串 在 string 中 的 起 始 索引 ( 子 串 第 1 个 字符 的 
索引 )。group 的 默认 值 为 0。 
end([group]): 返回 指定 的 组 截获 的 子 串 在 string 中 的 结束 索引 ( 子 串 最 后 一 个 字符 
的 索引 +1)。group 的 默认 值 为 0。 
。 span([group]): 返回 (start(group), end(group))。 
Match 对 象 的 相关 属性 和 方法 示例 如 下 : 
import re 
t="19:053259 
m=re.match(r'^(\d\d) \:(\d\d)\:(\d\d)$', t) #r 原 义 


print ("m.string:", m.string) #m.string: 19:05:25 

print (m. re) #re.compile('~^(\\d\A)\\: (dN\d) WN\: ((\\d\\qd))$') 
print ("m.pos:", m.pos) #m.pos: 0 

print ("m.endpos:", m.endpos) #m.endpos: 8 
print("m.lastindex:", m.lastindex) #m.lastindex: 3 

print ("m.lastgroup:", m.lastgroup) #m.lastgroup: None 

print ("m.group(0):", m.group(0)) #m.group (0): 19:05:25 
Drint("m group (Ll 2)", mgroup(l, 2)Y #m.group (1,2):('19', '05') 
print ("m.groups():", m.groups()) mgroups (th A “05 25.) 
print ("m.groupdict():", m.groupdict ()) #m.groupdict(): {} 

print ("m.start (2):", m.start (2)) #m.start (2): 3 

print ("m.end(2):", m.end(2)) #m.end(2): 5 

print ("m.span(2):", m.span(2)) #m.span (2): (3, 5) 


关于 分 组 的 内 容 见 后 面 。 
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是 要 提取 的 分 组 。 例 如 ^Qd{3))-Q\qd{3,8})$ 分 别 定 义 了 两 个 组 ， 可 以 直接 从 匹配 的 字符 串 中 


group(0) 永 远 是 原始 字符 串 ，group(1)、group(2) 表 示 第 1、2 个 子 串 。 
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2) 分 组 
除了 简单 地 判断 是 否 匹 配 之 外 ， 正 则 表达 式 还 有 提取 子 串 的 强大 功能 ， 用 0 表示 的 就 


提取 出 区 号 和 本 地 号 码 : 
>>> m=re.match(r'^(\d{3})-(\d{3,8})$"', '010-12345') 
>>> m.group (0) #"'010-12345" 
>>> m.group (1) #"'010" 
>>> m.group (2) #"'12345" 


如 果 正 则 表达 式 中 定义 了 组 , 就 可 以 在 Match 对 象 上 用 group0 方 法 提取 出 子 串 。 注意 


3) 切 分 字符 串 
用 正则 表达 式 切 分 字符 串 比 用 固定 的 字符 更 灵活 ， 请 看 普通 字符 串 的 切 分 代码 : 


2 i | #split (，') 表 示 按 空格 分 隔 
re se i en 


其 结果 是 无 法 识别 连续 的 空格 ,可 以 使 用 re.split0 方 法 来 分 割 字 符 串 ,例如 re.split(r\s+t'， 


text) 将 字符 串 按 空格 分 割 成 一 个 单词 列表 : 


S33 L601" NS ab cuy # 用 正则 表达 式 

[ia'， "bp ‘er] 

无 论 多 少 个 空格 都 可 以 正常 分 割 。 

再 例如 分 隔 符 既 有 空格 又 有 逗号 、 分 号 的 情况 : 

> rep (tr NeN ln arbe eo dh # 可 以 识别 空格 、i 

[ra', rb', rer, rd'] 

>>> re.split(r'[\s\,\;]+'，'a,b;; c d') ， # 可 以 识别 空格 、 喜 号 、 分 号 

[ia', hb', rer, 1d'] 

4) search() 和 findall() 方 法 

Ie.match() 总 是 从 字符 串 “ 开 头 ” 去 匹配 ， 并 返回 匹配 的 字符 串 的 Match 对 象 ， 所 以 当 
re.match() 去 匹配 非 “ 开 头 ” 部 分 的 字符 串 时 会 返回 None。 

strl='Hello Worldl! 

print (re.match(r'World', str1)) # 结 果 为 None 

如 果 想 在 字符 串 中 的 任意 位 置 去 匹配 ， 请 用 re.search() 或 re.findall()。 

re.search() 将 对 整个 字符 串 进行 搜索 ， 并 返回 第 1 个 匹配 的 字符 串 的 Match 对 象 。 

stri="Hello Worldl® 

print (re.search (r'World', str1)) 

输出 结果 如 下 : 


<_sre.SRE Match object; span=(6,11), match="'World'> 


re.findall0 函 数 将 返回 一 个 所 有 匹配 的 字符 串 的 字符 串 列表 。 例 如 : 


尚 
由 
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strl="Hi, I am Shirley Hilton. I am his wife.' 
>>> print (re.search(r'hi', str1)) 


以 上 代码 的 输出 结果 如 下 : 

<_ sre.SRE Match object; span=(10, 12), match="'hi'> 

此 时 应 用 re.findall0 函 数 : 

>>> re.findall(r'hi',str1) 

输出 结果 如 下 : 

['hi', "hi'] 

这 两 个 “hi” 分 别 来 自 “Shirley” 和 “his”。 在 默认 情况 下 正则 表达 式 是 严格 区 分 大 小 
写 的 ， 所 以 “Hi” 和 “Hilton” 中 的 “Hi” 被 忽略 了 。 

如 果 只 想 找到 “hi” 这 个 单词 ,而 不 把 包含 它 的 单词 计算 在 内 ， 那 就 可 以 使 用 “\bhi\b” 
这 个 正则 表达 式 。“\b” 在 正则 表达 式 中 表示 单词 的 开头 或 结尾 ， 空 格 、 标 点 、 换 行 都 算是 
单词 的 分 割 ， 而 “\b” 自 身 又 不 会 匹配 任何 字符 ， 它 代表 的 只 是 一 个 位 置 ， 所 以 单词 前 后 
的 空格 、 标 点 之 类 不 会 出 现在 结果 中 。 

在 前 面 的 例子 中 ,“\bhivb ”匹配 不 到 任何 结果 ， 因 为 没有 单词 hi (“Hi” 不 是 ， 严 格 区 
分 大 小 写 )。 但 如 果 是 “\bhi”， 就 可 以 匹配 到 1 个 “hi”， 出 自 “his”。 


5.3.2 中文 分 词 


在 英文 中 ， 单 词 之 间 是 以 空格 作为 自然 分 界 符 的 ; 而 中 文 只 是 句子 和 段 可 以 通过 明显 
的 分 界 符 来 简单 划分 ， 唯 独 词 没 有 一 个 形式 上 的 分 界 符 ， 虽 然 也 同样 存在 短语 之 间 的 划分 
题 ， 但 是 在 词 这 一 层 上 ， 中 文 要 比 英文 复杂 得 多 。 

中 文 分 词 就 是 将 连续 的 字 序 列 按照 一 定 的 规范 重新 组 合成 词 序列 的 过 程 。 中 文 分 词 是 
页 分 析 索 引 的 基础 。 分 词 的 准确 性 对 搜索 引擎 来 说 十 分 重要 ， 如 果 分 词 速度 太 慢 ， 即 使 
再 准确 ， 对 于 搜索 引擎 来 说 也 是 不 可 用 的 ， 因 为 搜索 引擎 需要 处 理 很 多 网 页 ， 如 果 分 析 消 
耗 的 时 间 过 长 ， 会 严重 影响 搜索 引擎 内 容 更 新 的 速度 。 因 此 ， 搜 索引 擎 对 于 分 词 的 准确 率 
和 速率 都 提出 了 很 高 的 要 求 。 

jieba 是 一 个 支持 中 文 分 词 、 高 准确 率 、 高 效率 的 Python 中 文 分 词组 件 ， 它 支持 繁体 
分 词 和 自 定义 词典 ， 并 支持 3 种 分 词 模式 。 

(1) 精确 模式 : 试图 将 句子 最 精确 地 切 开 ， 适 合 文本 分 析 。 

(2) 全 模式 ， 把 句子 中 所 有 可 以 成 词 的 词语 都 扫描 出 来 ， 速 度 非常 快 ， 但 是 不 能 解决 
歧义 的 问题 。 

(3) 搜索 引擎 模式 : 在 精确 模式 的 基础 上 对 长 词 再 次 切 分， 提高 召回 率 ， 适 合用 于 搜 
索引 擎 分 词 。 


5.3.3 ”安装 和 使 用 jieba 


在 命令 行 中 输入 以 下 代码 : 


= 
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n 项 目 案例 开发 
从 入 门 到 实战 一 疏 虫 、 游 戏 和 机 器 学 习 


pip install jieba 
如 果 出 现 以 下 提示 则 安装 成 功 。 


Installing collected packages: jieba 
Running setup.py install for jieba ... done 
Successfully installed jieba-0.38 


组 件 提供 了 jieba.cut() 方 法 用 于 分 词 ，cut() 方 法 接受 两 个 输入 参数 : 

(1) 第 1 个 参数 为 需要 分 词 的 字符 串 。 

(2) cut all 参数 用 来 控制 分 词 模式 。 

jieba.cut0 返 回 的 结构 是 一 个 可 友 代 的 生成 器 〈generator)， 可 以 使 用 for 循环 来 获得 分 
词 后 得 到 的 每 一 个 词语 ， 也 可 以 用 listGjieba.cut(...)) 转 化 为 list 列表。 例如: 

import jieba 

seg_1ist=jieba.cut ("我 来 到 北京 清华 大 学 "，cut_all=True) # 全 模式 

print ("Full Mode:", '/'.join(seg list)) 

seg 1ist=jieba.cut ("我 来 到 北京 清华 大 学 ") ”# 默 认 是 精确 模式 , 或 者 cut all =False 

print (type (seg list)) #<class 'generator'> 


print ("Default Mode:", '/'.join(seg list)) 
seg 1ist=jieba.cut for search ("我 来 到 北京 清华 大 学 ") ”# 搜 索引 擎 模式 
print ("搜索 引擎 模式 :"，'/'.join(seg list)) 
seg_l1ist=jieba.cut ("我 来 到 北京 清华 大 学 ") 
for word in seg list: 
print (word,end=' ') 


运行 结果 如 下 : 


Building prefix dict from the default dictionary ... 

Loading model from cache C:\Users\ADMINI~1\AppData\Local\Temp\jieba.cache 
Loading model cost 1.648 seconds. 

Prefix dict has been built succesfully. 

Full Mode: 我 /来 到 /北京 /清华 /清华 大 学 / 华 大 /大 学 

<class 'generator'> 

Default Mode: 我 /来 到 /北京 /清华 大 学 

搜索 引擎 模式 : 我 /来 到 /北京 /清华 / 华 大 /大 学 /清华 大 学 

我 来 到 北京 清华 大 学 


jieba.cut_for_search() 方 法 仅 有 一 个 参数 ， 为 分 词 的 字符 串 ， 该 方法 适用 于 搜索 引擎 构 
造 倒 排 索引 的 分 词 ， 粒 度 比较 细 。 


5.3.4 为 jieba 添加 自 定义 词典 
家 5A 级 景区 存在 很 多 与 旅游 相关 的 专 有 名 词 ， 举 个 例子 : 


输入 文本 ] 故宫 的 著名 景点 包括 乾 清 宫 、 太 和 殿 和 黄 琉璃 瓦 等 
精确 模式 ] 故宫 /的 /著名 景点 /包括 / 乾 / 清 宫 /、/ 太 和 殿 / 和 / 黄 /琉璃 瓦 /等 
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[全 模式 ] 故 宫 /的 /著名 /著名 景点 /景点 /包括 / 乾 / 清 宫 / 太 和 / 太 和 殿 / 和 / 黄 /琉璃 /琉璃 瓦 /等 

显然 ， 专 有 名 词 乾 清宫 、 太 和 殿 、 黄 琉璃 瓦 〈 假 设 为 一 个 文物 ) 可 能 因 分 词 而 分 开 ， 
这 也 是 很 多 分 词 工具 的 一 个 缺陷 。 但 是 jieba 分 词 支持 开发 者 使 用 自 定 定义 的 词典 ， 以 便 包 
含 jieba 词 库 里 没有 的 词语 。 虽 然 jieba 有 新 词 识别 能 力 ， 但 自行 添加 新 词 可 以 保证 更 高 的 
正确 率 ， 尤 其 是 专 有 名 词 。 
其 基本 用 法 如 下 : 
jieba.load userdict (file name) #file_name 为 自 定义 词典 的 路 径 
词典 格式 是 一 个 词 占 一 行 ， 每 一 行 分 3 个 部 分 ， 一 部 分 为 词语 ， 另 一 部 分 为 词 频 ， 最 
后 为 词性 〈 可 省 略 ，jieba 的 词性 标注 方式 和 ICTCLAS 的 标注 方式 一 样 。ns 为 地 点 名 词 ， 
nz 为 其 他 专用 名 词 ，a 是 形容 词 ，v 是 动词 ，d 是 副词 )，3 个 部 分 用 空格 隔 开 。 例 如 以 下 
自 定 义 词 典 dict.txt: 

乾 清宫 5 ns 

黄 琉 璃 瓦 4 

云 计算 5 

李 小 福 2 nr 

八 一 双 鹿 3 nz 

凯特 琳 2 nz 

下 面 是 导入 自 定义 词典 后 再 分 词 。 


import jieba 

jieba.load userdict ("dict.txt") # 导 入 自 定义 词典 
text=" 故 宫 的 著名 景点 包括 乾 清宫 、 太 和 殿 和 黄 琉璃 瓦 等 " 

seg list=jieba.cut (text, cut all=False) # 精 确 模 式 

print (" [精确 模式 ] : "，"/ ".join(seg list)) 


输出 结果 如 下 ， 其 中 专 有 名 词 连 在 一 起 ， 即 乾 清 宫 和 黄 琉璃 瓦 。 
[精确 模式 ] :故宫 / 的 / 著名 景点 / 包括 / 乾 清 宫 / 、/ 太 和 殿 / 和 / 黄 琉璃 瓦 / 等 


5.3.5 文本 分 类 的 关键 词 提取 


当 文 本 分 类 时 , 在 构建 VSM (向 量 空间 模型 ) 的 过 程 中 或 者 把 文本 转换 成 数学 形式 的 
计算 中 ， 需 要 运用 到 关键 词 提取 的 技术 ，jieba 可 以 简便 地 提取 关键 词 。 
其 基本 用 法 如 下 : 

jieba.analyse.extract tags (sentence, topK=20, withWeight =False, allowPOS=()) 

这 里 需要 先 import jieba.analyse。 其 中 ，sentence 为 待 提取 的 文本 ; topK 为 返回 几 个 
TF/IDF 权重 最 大 的 关键 词 , 默认 值 为 20; withWeight 为 是 否 一 并 返回 关键 词 权重 值 , 默认 
值 为 False; allowPOS 指 仅 包含 指 定 词性 的 词 ， 默 认 值 为 空 ， 即 不 进行 筛选 。 


import jieba,jieba.analyse 
jieba.load userdict ("dict.txt") 井 导 入 自 定义 词典 
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其 中 ， 午 门 出 现 3 次 、 乾 清宫 出 现 两 次 、 著 名 景点 上 


ython 项 目 案例 开发 
从 入 门 到 实战 一 一 仆 虫 、 游 戏 和 机 器 学 习 


text=" 故 富 的 著名 景点 包括 乾 清宫 、 太 和 殿 和 午 门 等 。 其 中 乾 清 宫 非常 精美 ， 午 门 是 紫禁城 的 
正门 ， 午 门 居中 向 阳 。" 
seg list=jieba.cut (text, cut all=False) 
print ("分 词 结果 : "，"/".join(seg list)) ## 精 确 模式 
tags=jieba.analyse.extract tags (text, topK=5) # 获 取 关 键 词 
print (" 关 键 词 : "，" " .join (tags)) 
tags=jieba.analyse.extract tags (text，topK=5,withWeight=True) 

# 返 回 关键 词 权 重 值 


Print (tags) 


输出 结果 如 下 : 


分 词 结果 : ”故宫 /的 /著名 景点 /包括 / 乾 清 宫 /、/ 太 和 殿 / 和 / 午 门 /等 /。/ 其 中 / 乾 清宫 /非常 / 精 


美 /，/ 午 门 /是 /紫禁城 /的 /正门 /，/ 午 门 /居中 /向 阳 /。 
关键 词 : 午 门 乾 清宫 著名 景点 太 和 殿 向 阳 


[(' 午 门 '"，1.5925323525975001),(' 乾 清宫 '，1.4943459378625)，,(' 著名 景点 '， 


0.86879235325)，(" 太 和 殿 '，0.63518800210625)，(" 向 阳 '"，0.578517922051875) ] 


提取 5 个 关键 词 ， 则 输出 “ 午 门 乾 清 宫 著名 景点 太 和 殿 向 阳 ”。 


章 


别 


5 


jieba.analyse.TFIDF (idf path=None)# 新 建 TF/IDF 实例 ，idf_path 为 IDF 频率 文件 


关键 词 提取 所 使 用 的 逆向 文件 频率 IDF) 文本 语料库 可 以 切换 成 自 定义 语料库 的 
路 径 。 


jieba.analyse.set idf path(file name) #file_name 为 自 定义 语料库 的 路 径 
关键 词 提取 所 使 用 的 停止 词 〈Stop Words) 文本 语料库 可 以 切换 成 自 定义 语料库 的 路 径 。 


说 明 : TF/IDF 是 一 种 统计 方法 , 用 于 评估 一 字 词 对 于 一 个 文件 集 或 一 个 语料库 中 的 一 
份 文件 的 重要 程度 。 字 词 的 重要 性 随 着 它 在 文件 中 出 现 的 次 数 成 正比 增加 ， 但 同时 会 随 着 
它 在 语料库 中 出 现 的 频率 成 反比 下 降 。TF/IDF 的 主要 思想 是 : 


FP 出 现 的 频率 TF 高 ， 并 且 在 其 他 文章 中 很 少 出 现 ， 则 认为 此 词 或 者 短语 具有 很 好 的 类 
区 分 能 力 ， 适 合用 来 分 类 。 


3.6 deque 


deque (double-ended queue 的 缩写 ) 双向 队列 类 似 于 list 列表 ， 位 于 Python 标准 库 
collections 中 。 它 提供 了 两 端 都 可 以 操作 的 序列 ， 这 意味 着 在 序列 的 前 后 都 可 以 执行 添加 


或 删除 操作 。 


@ 创建 双向 队列 deque 


from collections import deque 
d=deque () 


@ 添加 元 素 


d=deque () 
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b 现 1 次 。 如 果 topK=5， 按 照 顺 序 输出 


如 果 某 个 词 或 短语 在 一 篇 文 
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d.append (3) 

d.append (8) 

d.append (1) 

那么 此 时 d=deque([3,8,1])、len(d)=3、d[0]=3、d[-1]=1。 

deque 支持 从 任意 一 端 添加 元 素 。append0 用 于 从 右 端 添加 一 个 元 素 ，appendleft0 用 于 
从 左 端 添加 一 个 元 素 。 

全 两 端 都 使 用 pop 


a=deque(["1', 020 “3", "a4", "5"]) 


d.pop0 抛 出 的 是 '5'，d.popleft0 抛 出 的 是 '1'， 可 见 默 认 popO 抛 出 的 是 最 后 一 个 元 素 。 
四 限制 deque 的 长 度 


d=deque (maxlen=20) 
for i in range(30): 
d.append (str (i)) 


直 时 的 值 为 ddeque([10' "15 "12% "113% "14 "15', ”16 "17', "18'; "195"20', 21 22' 23, 
'24',25', 26','27','28','291], maxlen=20), 可 见 当 限制 长 度 的 deque 增加 超过 限制 数 的 项 时 另 
一 边 的 项 会 自动 删除 。 

全 添加 list 的 各 项 到 deque 中 


d=deque ([1,2,3,4,5]) 
d.extend([0]) 


那么 此 时 d=deque([1,2,3,4,5,0])。 
d.extendleft ([6,7,8]) 


此 时 d=deque([8,7,6,1,2,3,4,5,0])。 


5.4 程序 设计 的 步骤 


回 
5.4.1 “信息 采集 模块 一 网 络 仆 虫 的 实现 吾 ” 


网 络 候 虫 的 实现 原理 及 过 程 如 下 : 国名 史 入 

(1) 获取 初始 的 URL。 初 始 的 URL 地 址 可 以 由 用 户 指定 的 某 个 或 蘑 。 ”视频 讲解 
几 个 初始 息 取 网 页 决定 。 

(2) 根据 初始 的 URL 底 取 页 面 并 获得 新 的 URL。 在 获得 初始 的 URL 地 址 之 后 ,首先 
需要 抱 取 对 应 URL 地 址 中 的 网 页 ， 在 候 取 了 对 应 的 URL 地 址 中 的 网 页 后 将 网 页 存储 到 原 
始 数据 库 中 ， 并 且 在 疏 取 网 页 的 同时 发 现 新 的 URL 地址， 将 已 让 取 的 URL 地 址 存放 到 一 
个 已 候 URL 列表 中 ， 用 于 去 重复 判断 企 取 的 进程 。 

(3) 将 新 的 URL 放 到 URL 队列 中 。 注意， 在 第 2 步 中 获取 了 下 一 个 新 的 URL 地 址 
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on 项 目 案例 开发 
从 入 门 到 实战 一 一 爬虫 、 游 戏 和 机 器 学 习 
之 后 会 将 新 的 URL 地 址 放 到 URL 队列 中 。 

(4) 从 URL 队列 中 读 取 新 的 URL， 并 依据 新 的 URL 疏 取 网 页 ， 同 时 从 新 网 页 中 获取 
新 URL， 并 重复 上 述 的 聆 取 过 程 。 

(5) 当 满 足 怜 虫 系统 设置 的 停止 条 件 时 停止 疏 取 。 在 编写 聆 虫 的 时 候 一 般 会 设置 相应 
的 停止 条 件 ， 如 果 没 有 设置 停止 条 件 ， 疏 虫 会 一 直 疏 取 下 去 ， 直 到 无 法 获取 新 的 URL 地 址 
为 止 ， 若 设置 了 停止 条 件 ， 扑 虫 则 会 在 停止 条 件 满足 时 停止 假 取 。 

根据 图 5-4 所 示 的 网 络 爬 虫 的 实现 原理 及 过 程 ， 这 里 指定 中 原 工 学 院 新 闻 门 户 的 URL 
地 址 “http:/www.zut.edu.cn/index/xwdt.htm” 为 初始 的 URL。 


获取 初 
始 URL 


将 新 URL 放 
入 URL 队 列 


将 已 疏 取 地 
址 放 到 已 疏 
列表 中 


读 取 新 URL 


图 5-4 ”网络 爬虫 的 实现 原理 及 过 程 


使 用 unvisited 队列 存储 待 候 取 URL 链接 的 集合 并 使 用 广度 优先 搜索 ， 使 用 visited 集 
合 存储 已 访问 过 的 URL 链接 。 


unvisited=deque () # 待 息 取 链接 的 列表 ， 使 用 广度 优先 搜索 
visited=set () # 已 访问 的 链接 集合 


在 数据 库 中 建立 两 个 table， 其 中 一 个 是 doc 表 ， 存 储 每 个 网 页 ID 和 URL 链接 。 
create table doc(id int primary key,link text) 


例如 : 


1 http://www.zut.edu.cn/index/zxwdt.htm 

2 http://www.zut.edu.cn/info/1052/19838.htm 
3 http://www.zut.edu.cn/info/1052/19837.htm 
4 http://www.zut.edu.cn/info/1052/19836.htm 
5 http://www.zut.edu.cn/info/1052/19835.htm 
6 http://www.zut.edu.cn/info/1052/19834.htm 
7 http://www.zut.edu.cn/info/1052/19833.htm 


另 一 个 是 word 表 ， 即 倒 排 表 ， 存 储 词语 和 其 对 应 的 网 页 ID 的 list。 
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create table word (term Varchar (25) Primary key,list text) 


如 果 一 个 词 在 某 个 网 页 中 出 现 多 次 ， 那 么 list 中 这 个 网 页 的 序号 也 出 现 多 次 。list 最 后 
转换 成 一 个 字符 串 存 进 数据 库 。 

例如 ， 词 “ 王 宗 敏 ” 出 现在 网 页 ID 为 12、35、88 号 的 网 页 里 ，12 号 页 面 1 次 ，35 
号 页 面 3 次 ，88 号 页 面 两 次 ， 它 的 list 应 为 [12,35,35,35,88,88]， 转 换 成 字符 串 "12 35 35 35 
88 88" 存 储 在 word 表 的 一 条 记录 中 ， 形 式 如 下 : 


term list 
王 宗 鲁 12 35 35 35 88 88 
校友 会 54 190 190 701 986 986 1024 


扑 取 中 原 工 学 院 新 闻 网 页 的 代码 如 下 : 


#search engine build-2.py 
import sys 

from collections import deque 
import urllib 

from urllib import request 
import re 

from bs4 import BeautifulSoup 
import lxml 

import sqlite3 

import jieba 


url="'http://www.zut.edu.cn' # 入 口 
unvisited=deque () # 待 息 取 链接 的 集合 ， 使 用 广度 优先 搜索 
visited=set () # 已 访问 的 链接 集合 


unvisited.append (url) 


conn=sqlite3.connect ('viewsdu.db') 

c=conn.cursor() 

# 在 create table 之 前 先 drop table 是 因为 之 前 测试 的 时 候 已 经 建 过 table 了 ， 所 以 再 次 运 
# 行 代码 的 时 候 要 把 旧 的 table 删 了 重建 

c.execute('drop table doc') 

c.execute('create table doc(id int primary key,link text)') 
c.execute('drop table word') 

c.execute('create table word (term varchar(25) primary key,1ist text)') 
conn.commit () 

conn.close() 

print (iy 六 六 六 六 康 闪 六 六 六 闪闪 素 素 洲 开 -如 全 用 取 六 六 率 六 冰 六 六 六 六 六 六 闵 六 率 闵 率 闵 六 率 闵 六 闵 六 闪 人 

cnt=0 

Drinet" 开 始 wres 人 

while unvisited: 


url=unvisited.popleft () 
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pe 项 目 案例 开发 
从 入 门 到 实战 一 一 怜 虫 、 游 戏 和 机 器 学 习 


visited.add (url) 
Cnt+= 工 


print (' 开 始 抓 取 第 ' ,cnt, ' 个 链接 : url) 


# 疏 取 网 页 内 容 

二 
Fresponse=request-.-urlopen (url) 
content=response.read() .decode ('utf-8') 


except: 

continue 
# 寻 找 下 一 个 可 疏 的 链接 ， 因 为 搜索 范围 是 网 站 内 ， 所 以 对 链接 有 格式 要 求 ， 需 根据 具体 情况 而 定 
# 解 析 网 页 内 容 ， 可 能 有 几 种 情况 ， 这 也 是 根据 这 个 网 站 网 页 的 具体 情况 写 的 
soup=BeautifulSoup (content, 'lxml') 
all a=soup.find all('a',{'class':"c67214"}) ， 间 本 页 面 所 有 的 新 闻 链 接 <a> 
for a Lh All a 

#print (a.attrs['href']) 

X=a.attrsthret"l # 网 址 

if re.match(r'http.+',x) :# 排 除 是 http 开头 ， 而 不 是 http://www.zut.edu.cn 网 址 

if not re.match(r'http\:\/\/www\.zut\.edu\.cn\/.+',x): 


continue 
if re.match(r'\/info\/.+"',x): #"/info/1046/20314.htm" 
x="'http://www.zut.edu.cn'+x 
elif re.match(r'info/.+',x): #"info/1046/20314.htm" 
x="'http://www.zut.edu.cn/'+x 
elif re.match(r'\.\.\/info/.+',x): #"../info/1046/20314.htm" 


x="'http://www.zut.edu.cn'+x[2:] 
elif re.match(r'\.\.\/\.\.\/info/.+',x): #"../../info/1046/20314.htm" 
x="'http://www.zut.edu.cn'+x[5:] 
#print (x) 
if(x not in visited) and(x not in unvisited) : 
unvisited.append (x) 


a=soup.find('a',{'class':"Next"}) # 下 一 页 <a> 
if al=None: 
x=a.attrs['href'] # 网 址 
if re.match(r'xwdt\/.+',x): 
x="'http://www.zut.edu.cn/index/'+x 
elses 
x="'http://www.zut.edu.cn/index/xwdt/'+x 
if(x not in visited) and(x not in unvisited): 
unvisited.append (zx) 


以 上 代码 实现 要 疏 取 的 网 址 队列 unvisited。 
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5.4.2 ”索引 模块 一 一 建立 倒 排 词 表 


解析 新 闻 网 页 内 容 ， 这 个 过 程 需要 根据 这 个 网 站 网 页 的 具体 情况 来 处 理 。 


soup=BeautifulSoup (content, 'lxml') 
title=soup.title 


article=soup.find('div',class ='c67215 content' ,id='vsb newscontent') 


author=soup.find('span',class 


time=soup.find('span',class = 


="authorstyle67215") 间作 者 
timestyle67215") 


if title==None and article==None and author==None: 


print (' 无 内 容 的 页 面 。') 
continue 

elif article==None and author==None: 
print (' 只 有 标题 。') 
title=title.text 
title='' .join(title.split()) 
article=""' 
aotheor= 

elif article==None: 
print (' 有 标题 有 作者 ， 缺 失 内 容 ') 
title=title.text 
title=''.join(title.split()) 
article="" 


author=author.get text ("", strip=True) 


author='' .join(author.split()) 
elif author==None: 

print (' 有 标题 有 内 容 ， 缺 失 作者 ' ) 

title=title.text 

title=''.join(title.split()) 


article=article.get text("",strip=True) 


article=''.join(article.split()) 
author="" 

elase: 
title=title.text 
title=''.join(title.split()) 


article=article.get text("",strip=True) 


article='' .join(article.split()) 


author=author .get text("",strip=True) 


author="'' .join(author.split ()) 
print (' 网 页 标题 : ' ,title) 


提取 出 的 网 页 内 容 存在 于 title、article、author 中 


出 的 词语 建立 倒 排 词 表 。 


seggen=jieba.cut for search (title) 


Ph， 对 它们 进行 中 文 分 词 ， 六 


F 对 每 个 分 
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hon 项 目 案例 开发 
从 入 门 到 实战 一 一 爬虫 、 游 戏 和 机 器 学 习 


seglist=1ist(seggen) 
seggen=jieba.cut for search (article) 
seglist+=1ist(seggen) 
seggen=jieba.cut for search (author) 
seglist+=1ist(seggen) 


# 数 据 存储 
conn=sqlite3.connect ("viewsdu.db") 
c=conn.cursor () 
c.execute('insert into doc values(?,?)"', (cnt,url)) 
# 对 每 个 分 出 的 词语 建立 倒 排 词 表 
for word in seglist: 
#print (word) 
# 检 验 看 看 这 个 词语 是 否 已 存在 于 数据 库 
c.execute('select list from word where term=?', (word,)) 
result=c.fetchall () 
# 如 果 不 存在 
if len(result)==0: 
docliststr=str (cnt) 
c.execute('insert into word values(?,?)', (word,docliststr)) 
# 如 果 已 存在 
elses 
docliststr=result [0] [0] # 得 到 字符 串 
docliststr+=' '+str(cnt) 
c.execute ('update word set list=? where term=?', (docliststr,word)) 
conn.commit () 
conn.close() 


print (' 词 表 建立 完毕 !! ') 
以 上 代码 只 需 运 行 一 次 即 可 ， 搜 索引 擎 所 需 的 数据 库 已 经 建 好 。 运 行 上 述 代码 出 现 如 
下 结果 : 


开始 抓 取 第 110 个 链接 : http://www.zut.edu.cn/info/1041/20191.htm 
网 页 标题 我 校 2017 年 学 生 奖 助 项 目 评审 工作 完成 资助 育 人 成 效 显著 -中 原 工 学 院 
开始 抓 取 第 111 个 链接 : http://www.zut.edu.cn/info/1041/20190.htm 
网 页 标题 ”我 校 教师 李 幕 杰 、 王 学 鹏 参加 中 国 致 公 党 河南 省 第 一 次 代表 大 会 -中 原 工 学 院 
开始 抓 取 第 112 个 链接 : http://www.zut.edu.cn/info/1041/20187.htm 
网 页 标题 : 我 校 与 励 展 企业 开展 校 企 合作 -中 原 工学 院 

开始 抓 取 第 113 个 链接 : http://www.zut.edu.cn/info/1041/20184.htm 
网 页 标题 : 平顶山 学 院 李 培 副 校 长 一 行 来 我 校 考察 交流 -中 原 工学 院 

开始 抓 取 第 114 个 链接 : http://www.zut.edu.cn/info/1041/20179.htm 
网 页 标题 : 我 校 学 生 在 工程 造价 技能 大 赛 中 获 佳 绩 - 中 原 工学 院 

开始 抓 取 第 115 个 链接 : http://www.zut.edu.cn/info/1041/20178.htm 
网 页 标题 我 校 召开 2018 届 毕 业 生 就 业 工 作 会 议 - 中 原 工学 院 
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5.4.3 ”网 页 排名 和 搜索 模块 


当 需 要 搜索 的 时 候 执行 search_engine usepy， 完 成 网 页 排名 和 搜索 功能 。 
网 页 排名 采用 TF/IDF 统计 。TF/IDF 是 一 种 用 于 信息 检索 与 数据 挖掘 视频 讲解 
的 常用 加 权 技 术 。TF/IDF 统计 用 于 评估 一 词 对 于 一 个 文件 集 或 一 个 语料库 中 的 一 份 文 件 的 
重要 程度 。TF 的 意思 是 词 频 (Term Frequency)，IDF 的 意思 是 逆 文 本 频率 指数 (Inverse 
Document Frequency)。TF 表示 词 条 t 在 文档 d 中 出 现 的 频率 。IDF 的 主要 思想 是 : 如 果 包 
含 词 条 t 的 文档 越 少 ， 则 词 条 t 的 IDF 越 大 ， 说 明 词 条 t 具 有 很 好 的 类 别 区 分 能 力 。 

词 条 t 的 IDF 计算 公式 如 下 : 


idf= log(N/df) 
其 中 ，N 是 文档 总 数 ，df 是 包含 词 条 t 的 文档 数量 。 
在 本 程序 中 三 { 文 档 号 : 出 现 次 数 } 存 储 的 是 某 个 词 在 文档 中 出 现 的 次 数 。 例如 王 宗 敏 
的 {EE{12:1，35:3，88:2} 即 词 “ 王 宗 敏 ”出 现在 网 页 ID 为 12、35、88 号 的 网 页 里 ，12 号 
页 面 1 次 ，35 号 页 面 3 次 ，88 号 页 面 两 次 。 

score={ 文 档 号 : 文档 得 分 } 用 于 存储 命中 〈 搜 到 ) 文档 的 排名 得 分 。 


#search engine use.py 


import re 

import urllib 

from urllib import request 

from collections import deque 
from bs4 import BeautifulSoup 
import lxml 

import sqlite3 

import jieba 

import math 

conn=sqlite3.connect ("viewsdu.db") 
c=conn.cursor() 

c.execute('select count (*) from doc') 


N=1+c.fetchall () [0] [0] # 文 档 总 数 

target=input (' 请 输入 搜索 词 :' ) 

seggen=jieba.cut for search (target) # 将 搜索 内 容 分 词 

score={} # 字 典 ， 用 于 存储 “文档 号 : 文档 得 分 ” 


for word in seggen: 
print (' 得 到 查询 词 : ' ,word) 
tf={} # 文 档 号 : 次 数 {12: 1，35: 3，88: 2} 
c.execute('select list from word where term=?', (word,)) 
result=c.fetchall () 
if len(result)>0: 
doclist=result[0] [0] 字符 串 “12 35 35 35 88 88” 
doclist=doclist.split(' ') 
doclLst= Lint For x ndocLustI RD 2 
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pr 项 目 案例 开发 


从 入 门 到 实战 一 一 怜 虫 、 游 戏 和 机 器 学 习 


# 把 字符 串 转 换 成 元 素 为 int 的 1ist[12,35,88] 
df=len(set (doclist) ) # 当 前 word 对 应 的 df 数 ， 注 意 set 集合 实现 去 掉 重复 项 
idf=math.1og(N/df) 间 计 算出 IDF 
printtuidfs “idE) 
for num in doclist: # 计 算 词 频 TFE， 即 在 某 文档 中 出 现 的 次 数 
if num in tf: 
tf[num]=tf[num]+1 
else: 
tf[num]=1 
#TF 统计 结束 ， 现 在 开始 计算 score 
for num in tf: 
if num in score: 
# 如 果 该 num 文档 已 经 有 分 数 了 ， 则 累加 
score [num]=score [num] +tf[num]*idf 
< 
score [num]=tf[num]*idf 


sortedlist=sorted (score.items () ,key=lambda d:d[1],reverse=True) 


# 对 score 字典 按 字 典 的 值 排序 


#print (' 得 分 列表 '，, sortedlist) 
cnt=0 
for num,docscore in sortedlist: 


汪 玉 
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c.execute('select link from doc where id=?', (num,)) 
# 按 照 ID 获取 文档 的 连接 网址》 
url=c.fetchall () [0] [0] 
print (url ，' 得 分 : ', docscore) # 输 出 网 址 和 对 应 得 分 
try 
response=request .urlopen (url) 
content=response.read() .decode ('utf-8') # 可 以 输出 网 页 内 容 
except: 
print ('oops.. . 读 取 网 页 出 错 ') 
continue 
# 解 析 网 页 输出 标题 
soup=BeautifulSoup (content, 'lxml') 
title=soup.title 
if title==None: 
print('No title.') 
else: 
title=title.text 
print (title) 
1F CAES20: # 超 过 20 条 则 结束 ， 即 输出 前 20 条 
break 
cnt=—=0: 


print (' 无 搜索 结果 ') 
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当 运 行 search_engine_ usepy 时 出 现 如 下 提示 : 
请 输入 搜索 词 : 王 宗 敏 


Building prefix dict from the default dictionary ... 

Loading model from cache C:\Users\xmj\AppData\Local\Temp\jieba.cache 
Loading model cost 0.961 seconds. 

Prefix dict has been built succesfully. 

得 到 查询 词 : 王 宗 敏 

idf: 3.337509562404897 

http://www.zut.edu.cn/info/1041/20120.htm 得 分 : 13.350038249619589 
王 宗 敏 校长 一 行 参 加 深圳 校友 会 年 会 并 走访 合作 企业 -中 原 工学 院 
http://www.zut.edu.cn/info/1041/20435.htm 得 分 : 13.350038249619589 
中 国 工程 院 张 彦 仲 院士 莅临 我 校 指导 工作 -中 原 工学 院 
http://www.zut.edu.cn/info/1041/19775.htm 得 分 : 10.012528687214692 
我 校 河 南 省 功能 性 纺织 材料 重点 实验 室 接受 现场 评估 -中 原 工学 院 
http://www.zut.edu.cn/info/1041/19756.htm 得 分 : 10.012528687214692 
王 宗 敏 校长 召开 会 议 推进 “十 三 五 ”规划 “ 八 项 工程 ”建设 -中 原 工学 院 
http://www.zut.edu.cn/info/1041/19726.htm 得 分 : 10.012528687214692 
我 校 2017 级 新 生 开 学 典礼 隆重 举行 -中 原 工 学 院 
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6.1 程序 功能 介绍 


使 用 网 络 疏 虫 技术 疏 取 百度 图 片 某 主题 的 相关 图 片 ， 并 且 能 按 某 一 关 5 视频 讲解 
键 字 搜 索 图 片 下 载 到 本 地 指定 的 文件 夹 中 。 本 程序 主要 完成 下 载 功 能 ， 不 需要 设计 图 形 化 
界面 。 在 运行 时 出 现 如 下 提示 : 

Please input you want search: 

让 用 户 输入 关键 词 ， 例 如 输入 “ 夏 敏 捷 ” 然后 按 回 车 键 , 则 看 到 如 图 6-1 所 示 的 效果 。 


101117/B0040IF6VQ_01_amzn. jpg 
,jpg 


65/1475/95954025. jpg 


图 6-1 疏 取 百度 图 片 运行 效果 示意 图 
从 图 6-1 可 以 看 到 开始 下 载 了 。 


6.2 程序 设计 的 思路 


一 般 来 说 ， 制 作 一 个 候 虫 需要 分 以 下 几 个 步骤 : 
(1) 分 析 需 求 ， 这 里 的 需求 就 是 候 取 网 页 图 片 。 
(2) 分 析 网 页 源 代码 和 网 页 结构 ， 配 合 F12 键 查看 网 页 源 代码 。 
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(3) 编写 正则 表达 式 或 者 XPath 表达 式 。 
(4) 正式 编写 Python 怜 虫 代码 。 
本 章 按照 该 步骤 实现 按 关键 词 候 取 百 度 图 片 。 


6.3 关键 技术 
6.3.1 ”图片 文件 下 载 到 本 地 


@ 使 用 request.urlretrieve0 函 数 

如 果 要 把 对 应 图 片 文件 下 载 到 本 地 ， 可 以 使 用 urlretrieve(O 函 数 。 

from urllib import request 

request .urlretrieve ("http://www.zzti.edu.cn/ mediafile/index/2017/06/24 

/lqjdyc7vq5.jpg", "aaa.jpg") 

上 例 就 可 以 把 网 络 上 中 原 工 学 院 的 图 片 资源 1qjdyc7vq5.jpg 下 载 到 本 地 ， 生 成 aaa.jpg 
图 片 文件 。 

四 使 用 Python 的 文件 操作 函数 write0 写 人 文件 


from urllib import request 


import urllib 

url="' http://www.zzti.edu.cn/ mediafile/index/2017/06/24/1qjdyc7vq5.jpg 

urll=urllib. request.Request (url) #Request () 函数 将 url 添加 到 头 部 ， 
# 模 拟 浏览 器 访问 

page=urllib.request.urlopen (url1) .read()  # 将 url 页 面 的 源 代码 保存 成 字符 串 

#open () .write() 方 法 原始 且 有 效 

open('C:\\aaa.jpg', 'wb') .write (page) # 写 入 aaa .jpg 文件 中 


6.3.2 ”把 取 指定 网 页 中 的 图 片 


首先 用 urllib 库 来 模拟 浏览 器 访问 网 站 的 行为 ， 由 给 定 的 网 站 链接 (url) 得 到 对 应 网 
页 的 源 代码 (html 标签 )。 其 中 ， 源 代码 以 字符 串 的 形式 返回 。 
然后 用 正则 表达 式 re 库 在 字符 串 〈 网 页 源 代码 ) 中 匹配 表示 图 片 链接 的 小 字符 串 ， 返 
一 个 列表 。 
最 后 循环 列表 ， 根 据 图 片 链接 将 图 片 保存 到 本 地 。 
urllib 库 的 使 用 在 Python2.x 和 Python3.x 中 的 差别 很 大 ， 本 案例 以 Python3.x 为 例 。 


第 一 个 简单 的 疏 取 图 片 程序 ， 使 用 Python3-x 和 urllipb 与 re 库 


互 


import urllib.request 
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import re # 正 则 表达 式 
def getHtmlCode (url) :  # 该 方法 传 入 url， 返 回 url 的 html 的 源 代码 
headers={ 
'User-Agent': 'Mozilla/5.0 (Linux; Android 6.0; Nexus 5 Build/MRA58N) 
AppleWebKit/537.36 (KHTML, like Gecko) Chrome/56.0.2924.87 Mobile 
Safari/537.36"' 
} 
urll=urllib.request.Request (url, headers=headers) 
#Request () 函数 将 url 添加 到 头 部 ， 模 拟 浏览 器 访问 
page=urllib.request.urlopen (url1) .read () 
# 将 url 页 面 的 源 代码 保存 成 字符 串 
page=page.decode ('UTF-8') ，# 字 符 串 转 码 
return page 


def getImg (page) :# 该 方法 传 入 html 的 源 代码 ， 经 过 截取 其 中 的 img 标签 ， 将 图 片 保存 到 本 机 
imgList=re.findall (r' (http: [^\s]*? (jpglpnglgif))"',page) 
x=0 
for imgUrl in imgList: # 列 表 循 环 
二 TY 
print (' 正 在 下 载 : $s'%imgUr1[0]) 
#urlretrieve (url, local) 方 法 根据 图 片 的 url 将 图 片 保 存 到 本 机 
urllib.request.urlretrieve (imgUrl1[0], 'E:/img/%d.jpg'%x) 
Xx+=1 
except: 
continue 


if _ name =='_ main _': 
url='http://blog.csdn.net/qq 32166627/article/details/60345731"' 
# 指 定 网 址 页 面 
page=getHtmlCode (url) 
getImg (Page) 
对 于 findall( 正 则 表达 式 ,代表 页 面 源 代码 的 st 函数 ， 在 字符 串 中 按照 正则 表达 式 截取 
其 中 的 子 字 符 串 ，findall0 返 回 一 个 列表 ， 列 表 中 的 元 素 是 一 个 个 元 组 ， 元 组 的 第 1 个 元 素 
是 图 片 的 url， 第 2 个 元 素 是 url 的 扩展 名 ， 列 表 形 式 如 下 : 
[('http://avatar.csdn.net/4/E/B/1 qq 32166627.jpg', "jpg")， 


('http://avatar.csdn.net/1/1/4/2 fly yr.jpg', 'jpg'), 
('http://avatar.csdn.net/8/1/3/2 u013007900.jpg', 'jpg'), 


('http://avatar.csdn.net/1/B/B/1 csdn.jpg', 'jpg')] 


上 述 代 码 在 找 图 片 的 ul 时 用 的 是 re (正则 表达 式 )。re 用 得 好 会 有 奇效 ， 用 得 不 好 效 
果 极 差 。 
既然 得 到 了 网 页 的 源 代码 ， 就 可 以 根据 标签 的 名 称 得 到 其 中 的 内 容 。 
F 正则 表达 式 难 以 掌握 ， 这 里 用 一 个 第 三 方 库 一 一 BeautifulSoup， 它 可 以 根据 标签 


站 
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的 名 称 对 网 页 内 容 进行 截取 。BeautifulSoup4 的 中 文 文档 请 参见 页 面 “http://beautifulsoup. 
readthedocs.io/zh CN/latest/”。 


6.3.3 ”BeautifulSoup 库 概述 


BeautifulSoup 〈 英 文 原意 是 美丽 的 蝴蝶 ) 是 一 个 Python 处 理 HTML/XML 的 函数 库 ， 
是 Python 内 置 的 网 页 分 析 工 具 ， 用 来 快速 地 转换 被 抓 取 的 网 页 。 它 产生 一 个 转换 后 DOM 
树 ， 尽 可 能 和 原文 档 内 容 的 含义 一 致 ， 这 种 措施 通常 能 够 满足 用 户 搜集 数据 的 需求 。 
BeautifulSoup 提供 了 一 些 简单 的 方法 以 及 类 Python 语法 来 查找 、 定 位 、 修 改 一 棵 转换 
后 DOM 树 。BeautifulSoup 自动 将 送 进来 的 文档 转换 为 Unicode 编码 ， 而 且 在 输出 的 时 候 
转换 为 UTF-8。BeautifulSoup 可 以 找 出 “所 有 的 链接 <a> ”， 或 者 “所 有 class 是 xxx 的 链 
接 <a>”， 再 或 者 是 “所 有 匹配 .cn 的 链接 url”。 
【1) BeautifulSoup 的 安装 
使 用 pip 直接 安装 BeautifulSoup4: 


pip3 install beautifulsoup4 


推荐 在 现在 的 项 目 中 使 用 BeautifulSoup4 (bs4)， 导 入 时 需要 import bs4。 

四 BeautifulSoup 的 基本 使 用 方式 

下 面 使 用 一 段 代码 演示 BeautifulSoup 的 基本 使 用 方式 。 

from bs4 import BeautifulSoup 

#qdoc 可 以 是 一 个 HTML 内 容 的 字符 串 ， 本 例 是 列表 ， 需 要 转换 成 字符 串 

doc=['<html><head><title> The story of Monkey </title></head>', 
'<body><p id="firstpara" align="center">This is one paragraph </p>', 


'<p id="secondpara" align="center">This is two paragraph </p>', 
'</html>'] 
soup=BeautifulSoup('' .join(doc)，"html.parser") 
# 提 供 字符 串 信息 ，'" ' . join (doc) 将 其 合并 为 字符 串 
print (soup.prettify()) 


在 使 用 时 BeautifulSoup 首先 要 导入 bs4 库 : 
from bs4 import BeautifulSoup 


创建 BeautifulSoup 对 象 : 


soup=BeautifulSoup (html) 
另外 ， 还 可 以 用 本 地 HIML 文件 来 创建 对 象 ， 例 如 : 
soup=BeautifulSoup (open ('index.html') ，"html.parser") 间 提供 本 地 HTML 文件 


上 面 的 代码 是 将 本 地 index.html 文件 打开 ， 用 它 来 创建 soup 对 象 。 
户 也 可 以 使 用 网 址 URL 获取 HTML 文件 ， 例 如 : 


from urllib import request 


response=request .urlopen ("http://www.baidu.com") 
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html=response.read() 


html=html .decode ("utf-8") #decode() 用 于 将 网 页 的 信息 进行 解码 ， 否 则 会 产生 乱码 


soup=BeautifulSoup (html, "html.parser") 砷 远程 网 站 上 的 HTML 文件 
程序 段 最 后 格式 化 输出 BeautifulSoup 对 象 的 内 容 。 
print (soup.prettify()) 
运行 结果 如 下 : 
<html> 
<head> 

<title> The story of Monkey </title> 
</head> 
<body> 

<p align="center" id="firstpara"> 

This is one paragraph 

</p> 

<p align="center" id="secondpara"> 

This is two paragraph 

</p> 
</body> 
</html> 


以 上 便 是 输出 结果 ， 格 式 化 打印 出 了 BeautifulSoup 对 象 (DOM 树 ) 的 内 容 。 


BeautifulSoup 将 复杂 的 HTML 文档 转换 成 一 个 复杂 的 树 形 结构 ， 其 中 每 个 结 点 都 是 


Python 对 象 。 所 有 对 象 可 以 归纳 为 4 种 ， 即 Tag、NavigableString、BeautifulSoup (前 
子 中 已 经 使 用 过 )、Comment。 

1) Tag 对 象 

Tag 是 什么 ?通俗 点 讲 就 是 HTML 中 的 一 个 个 标签 ， 例 如 : 


<title> The story of Monkey </title> 
<a href="http://example.com/elsie" id="linkl">Elsie</a> 


例 


上 面 的 <title>、<a> 等 HTML 标签 加 上 里 面包 括 的 内 容 就 是 Tag， 下面 用 BeautifulSoup 


来 获取 Tags。 


print (soup.title) 
print (soup.head) 


输出 如 下 : 


<title> The story of Monkey </title> 
<head><title> The story of Monkey </title></head> 


户 可 以 用 BeautifulSoup 对 象 soup 加 标签 名 轻松 地 获取 这 些 标签 的 内 容 , 但 应 注意 ， 


它 查 找 的 是 所 有 内 容 中 第 1 个 符合 要 求 的 标签 ， 对 于 查询 所 有 的 标签 ， 将 在 后 面 进行 介绍 。 


可 以 验证 一 下 这 些 对 象 的 类 型 。 


print (type (soup.title)) # 输 出 : <class 'bs4.element.Tag'> 
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对 于 Tag， 它 有 两 个 重要 的 属性 一 一 name 和 attrs， 下 面 分 别 来 感受 一 下 。 


print (soup.name) # 输 出 : [document] 

print (soup.head.name) # 输 出 : head 

soup 对 象 本 身 比 较 特 殊 ， 它 的 name 即 为 [document]， 对 于 其 他 内 部 标签 ， 输 出 的 值 便 
为 标签 本 身 的 名 称 。 


print (soup.p 


.attrs) 4 输出 Dad "Firstpara, "align's "center’y 


在 这 里 把 p 标签 的 所 有 属性 打印 输出 ， 得 到 的 类 型 是 一 个 字典 。 
如 果 想 要 单独 获取 某 个 属性 ， 例 如 获取 它 的 ID 可 以 这 样 做 : 


print (soup.p 


"id']) # 输 出 : firstpara 


另外 还 可 以 利 上 


print (soup.p 


get0 方 法 传 入 属性 的 名 称 ， 二 者 是 等 价 的 。 
ey # 输 出 : firstpara 


用 户 可 以 对 这 些 属性 和 内 容 等 进行 修改 ， 例 如 : 


soup.p['class']="newClass" 


另外 还 可 以 对 这 个 属性 进行 删除 ， 例 如 : 
del soup.p['class'] 


2) NavigableString 对 象 
既然 已 经 得 到 了 标签 的 内 容 ， 要 想 获取 标签 内 部 的 文字 怎么 办 呢 ? 很 简单 ， 用 .string 


即 可 ， 例 如 : 


soup .title.string 

这 样 就 轻松 获取 到 了 标签 里 面 的 内 容 ， 如 果 用 正则 表达 式 则 麻烦 得 多 。 

3) BeautifulSoup 对 象 

BeautifulSoup 对 象 表 示 的 是 一 个 文档 的 全 部 内 容 。 大 部 分 时 候 可 以 把 它 当 作 Tag 对 象 ， 
它 是 一 个 特殊 的 Tag， 下 面 的 代码 可 以 分 别 获 取 它 的 类 型 、 名 称 以 及 属性 。 


Print (type(soup) ) # 输 出 : <class 'bs4.BeautifulSoup'> 
print (soup.name) # 输 出 : [document] 
print (soup.attrs) # 输 出 空 字典 : {) 


4) Comment 对 象 
Comment (注释) 对 象 是 一 个 特殊 类 型 的 NavigableString 对 象 ， 其 内 容 不 包括 注释 符 
号 ， 如 果 不 好 好 地 处 理 它 ， 可 能 会 对 文本 处 理 造成 意 想不到 的 麻烦 。 


6.3.4 用 BeautifulSoup 库 操 作 解 析 HTML 文档 树 


@ 遍历 文档 树 


1) 用 .content 属性 和 .children 属性 获取 直接 子 结 点 


Tag 的 .content 


属性 可 以 将 Tag 的 子 结 点 以 列表 的 方式 输出 。 
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获取 


的 子 


从 入 门 到 实战 一 一 看 虫 、 游 戏 和 机 器 学 习 
print (soup.body.contents) 
输出 : 


[<p align="center" id="firstpara">This is one paragraph</p>, 
<p align="center" id="secondpara">This is two paragraph</p>] 


上 时 输出 为 列表 ， 可 以 用 列表 索引 来 获取 它 的 某 一 个 元 素 。 
print (soup.body.contents[0]) # 获 取 第 1 个 <p> 


输出 : 


<p align="center" id="firstpara">This is one paragraph </p> 
.children 属性 返回 的 不 是 一 个 list， 它 是 一 个 list 生成 器 对 象 ， 不 过 用 户 可 以 通过 遍历 
所 有 子 结 点 。 


for child in soup.body.children: 
print (child) 


输出 : 


<p align="center" id="firstpara"> This is one paragraph </p> 


<p align="center" id="secondpara">This is two paragraph </p> 

2) 用 .descendants 属性 获取 所 有 子孙 结 点 

.contents 和 .children 属性 仅 包含 Tag 的 直接 子 结 点 ，.descendants 属性 可 以 对 所 有 Tag 
和 孙 结 点 进行 递归 循环 ， 和 .children 类 似 ， 用 户 也 需要 遍历 获取 其 中 的 内 容 。 

for child in soup.descendants: 


print (child) 


可 以 发 现 ， 所 有 的 结 点 都 被 打印 出 来 ， 先 是 最 外 层 的 HTML 标签 ， 其 次 从 head 标签 


一 个 个 剥离 ， 依 此 类 推 。 


只 有 


如 果 一 个 标签 里 面 没 有 标签 了 ， 那 么 .string 就 会 返回 标签 里 面 的 内 容 。 如 果 标 签 里 面 
唯一 的 一 个 标签 ， 那 么 .string 也 会 返回 最 里 面 标签 的 内 容 。 
如 果 Tag 包含 了 多 个 子 标签 结 点 ，Tag 将 无 法 确定 .string 方法 应 该 调用 哪个 子 标签 结 


点 的 内 容 ，.string 的 输出 结果 是 None。 


print (soup. title.string) # 输 出 <title> 标 签 里 面 的 内 容 

print (soup. body.string) #<body> 标 签 包含 了 多 个 子 结 点 ， 所 以 输出 None 
输出 : 

The story of Monkey 

None 

4) 父 结 点 


.parent 属性 用 于 获取 父 结 点 。 
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p=soup .title 
print (p.parent .name) # 输 出 父 结 点 名 Head 


输出 : 
Head 
以 上 是 遍历 文档 树 的 基本 用 法 。 
@ 搜索 文档 树 


1) find all(name, attrs, recursive, text, **kwargs) 

find_all0 方 法 搜索 当前 Tag 的 所 有 Tag 子 结 点 ， 并 判断 是 否 符合 过 滤器 的 条 件 ， 其 参 
数 如 下 。 

(1) name 参数 : 可 以 查找 所 有 名 字 为 name 的 标签 。 


print (soup.find all('p')) # 输 出 所 有 <p> 标 签 
[<p align="center" id="firstpara">This is one paragraph</p>, <p align= 


"center" id="secondpara">This is two paragraph</p>] 
如 果 name 参数 传 入 正则 表达 式 作 为 参数 ，BeautifulSoup 会 通过 正则 表达 式 的 match() 
来 匹配 内 容 。 下 面 的 例子 找 出 所 有 以 h 开头 的 标签 。 


for tag in soup.find alll(re.compile("^h")): 
print (tag.name, end=" ") #html head 


输出 : 
html head 


这 表示 < html > 和 < head > 标签 都 被 找到 。 
(2) attrs 参数 : 按照 tag 标签 属性 值 检索 ， 需 要 列 出 属性 名 和 值 ， 采 用 字典 形式 。 


soup.find all('p',attrs={'id':"firstpara"}) 或 者 soup.find alll('p', {'id': 


"firstpara"}) 


它们 都 是 查找 属性 值 id 是 "firstpara" 的 <p> 标 签 。 

当然 也 可 以 采用 关键 字形 式 “soup.find_all('p', {id="firstpara"})”。 

(3) recursive 参数 : 在 调用 Tag 的 find_all0 方 法 时 BeautifulSoup 会 检索 当前 Tag 的 所 
有 子孙 结 点 ， 如 果 只 想 搜索 Tag 的 直接 子 结 点 ， 可 以 使 用 recursive=False。 

(4) text 参数 : 通过 text 参数 可 以 搜索 文档 中 的 字符 串 内 容 。 

print (soup.find all (text=re.compile ("paragraph") ) )#re.compile() 正则 表达 式 

输出 2 

['This is one paragraph', 'This is two paragraph'] 

re.compile("paragraph") 为 正则 表达 式 ， 表 示 所 有 含有 “paragraph” 的 字符 串 都 匹配 。 

(5) limit 参数 ，find_all0 方 法 返回 全 部 的 搜索 结构 ， 如 果 文 档 树 很 大 ， 那 么 搜索 会 很 
慢 。 如果 用 户 不 需要 全 部 结果 ， 可 以 使 用 limit 参数 限制 返回 结果 的 数量 ， 当 搜索 到 的 结果 
数量 达到 limit 的 限制 时 就 停止 搜索 返回 结果 。 
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文档 树 中 有 两 个 Tag 符合 搜索 条 件 ， 但 结果 只 返回 了 1 个 ， 因 为 限制 了 返回 数量 。 


soup.find all("p", limit=1) 


输出 : 


[<p align="center" id="firstpara">This is one paragraph</p>] 


2) findname, attrs, recursive, text) 


它 与 find_all0 方 法 唯一 的 区 别 是 find_all0 方 法 返回 全 部 结果 的 列表 ， 而 find() 方 法 返 


回 找到 的 第 1 个 结果 。 
@ 用 CSS 选择 器 筛选 元 素 


在 写 CSS 时 标签 名 不 加 任何 修饰 ， 类 名 前 加 点 ，ID 名 前 加 #。 在 这 里 也 可 以 利用 类 似 
的 方法 来 筛选 元 素 ， 用 到 的 方法 是 soup.select)， 返 回 类 型 是 列表 。 


(1) 通过 标签 名 查找 : 
soup.select ('title') # 选 取 <title> 元 素 


(2) 通过 类 名 查找 : 


soup.select (' .firstpara') # 选 取 class 是 firstpara 的 元 素 
soup.select one(".firstpara") 查找 class 是 firstpara 的 第 1 个 元 素 


(3) 通过 id 名 查找 : 


soup.select ('#firstpara') # 选 取 id 是 firstpar 


a 的 元 素 


以 上 的 select0 方 法 返回 的 结果 都 是 列表 形式 , 可 以 用 遍历 形式 输出 ,然后 用 get_text() 


方法 或 text 属性 来 获取 它 的 内 容 。 


soup=BeautifulSoup (html, 'html.parser') 
print type(soup.select('div')) 


print (soup.select ('div') [0] .get text ()) # 输 出 首 个 <div> 元 素 的 内 容 


for title in soup.select('title') : 


print (title. text) # 输 出 所 有 <div> 元 素 的 内 容 
处 理 网 页 需要 对 HTML 有 一 定 的 了 解 ，BeautifulSoup 库 是 一 个 非常 完备 的 HTML 解 


析 函 数 库 ， 有 了 BeautifulSoup 库 的 知识 ， 就 可 以 进行 网 络 息 9 


from bs4 import BeautifulSoup 


实战 了 。 


def getHtmlCode (url1): # 该 方法 传 入 url， 返 回 url 的 html 的 源 代码 
headers={ 
'User-Agent': 'MMozilla/5.0(Windows NT 6.1; WOW64; rv:31.0) Gecko/ 


20100101 Firefox/31.0" 
4 


urll=urllib.request.Request (url, headers=headers) 


#Request () 函数 将 url 添加 到 头 部 ， 模 拟 浏览 器 访问 


page=urllib.request.-urlopen (url1) .read () 


# 将 url 页 面 的 源 代码 保存 成 字符 串 


page=page.decode ('UTF-8') ”字符 串 转 码 
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return page 


def getImg (page, localPath): 
非 该 方法 传 入 html 的 源 代码 ， 截 取 其 中 的 img 标签 ， 将 图 片 保存 到 本 机 
soup=BeautifulSoup (page, 'html .parser') # 按 照 html 格式 解析 页 面 


imgList=soup.find all('img') # 返 回 包含 所 有 img 标签 的 列表 
X=0 
for imgUrl in imgList: # 列 表 循 环 


print (' 正 在 下 载 : $s'%imgUrl.get ('src')) 
#urlretrieve (url, local) 方 法 根据 图 片 的 url 将 图 片 保 存 到 本 机 
urllib.request .urlretrieve (imgUrl.get ('src'),1localPath+'%d.jpg'%x) 
ZX+=1 
if _ name =='_ main _': 

url="'http://www.zhangzishi.cc/20160928gx.html' 

localPath='E:/img/"' 

page=getHtmlCode (url) 

getImg (page, localPath) 


可 见 使 用 BeautifulSoup 能 比 使 用 正则 表达 式 更 简单 地 找到 所 有 img 标签 。 


6.3.5 ”requests 库 的 使 用 


requests 库 和 urllib 库 的 作用 相似 且 使 用 方法 基本 一 致 , 都 是 根据 HITP 协议 操作 各 种 
消息 和 页 面 ， 但 使 用 requests 库 比 使 用 urllib 库 更 简单 些 。 

各 requests 库 的 安装 

使 用 pip 直接 安装 requests: 

pip3 install requests 

安装 后 进入 Python 导入 模块 测试 是 否 安 装 成 功 。 

import requests 

没有 出 错 即 安装 成 功 。 

对 于 requests 库 的 使 用 ， 请 读者 参阅 “http://cn.python-requests.org/zh_CN/latest/”。 

四 发 送 请 求 

发 送 请 求 很 简单 ， 首 先 要 导入 requests 模块 : 


>>>import requests 

接 下 来 获取 一 个 网 页 ， 例 如 中 原 工学 院 的 首页 : 

>>>r=requests.get ('http://www.zut.edu.cn') 

之 后 就 可 以 使 用 这 个 工 的 各 种 方法 和 函数 了 。 

另外 ，HTTP 请 求 还 有 很 多 类 型 ， 例 如 POST、PUT、DELETE、HEAD、OPTIONS， 
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从 入 门 到 实战 一 一 看 虫 、 游 戏 和 机 器 学 习 


可 以 


同样 的 方式 实现 : 


>>> r=requests.post ("http://httpbin.org/post") 


>>> r=requests.head("http://httpbin.org/get") 


@ 在 URL 中 传递 参数 
有 时 候 需要 在 URL 中 传递 参数 ,比如 在 采集 百度 搜索 结果 时 , 对 于 wd 参数 (搜索 词 ) 


和 m 参数 (搜索 结果 数量 )， 可 以 通过 字符 串 连接 的 形式 手工 组 成 URL， 但 requests 提供 


了 一 


上 实 


| 获 


种 简单 的 方法 : 


>>> payload={'wd' : ' 夏 敏捷 '，'rn': '100'} 
>>> r=requests.get ("http://www.baidu.com/s", params=payload) 
>>> print(r.url) 


结果 如 下 : 
http://www.baidu.com/s?wd=%E5%A4%8F%SE6%95%8F$SE6%8DSB7&rn=100 


上 面 wd= 的 乱码 就 是 “ 夏 敏捷 ”的 URL 转 码 形式 。 


POST 参数 请 求 例子 如 下 : 

requests.post ('http://www.itwhy.org/wp-comments-post.php', data= 
{'comment': ' 测 试 PosT'}) #POST 参数 

@ 获取 响应 内 容 


>>> Fr=requests.get('http://www.baidu.com') # 返 回 一 个 Response 对 象 上 
>>> 工 .七 ext 


在 使 用 requests() 方 法 后 会 返回 一 个 Response 对 象 ， 其 存储 了 服务 器 响应 的 内 容 ， 如 
例 中 已 经 提 到 的 rtext。 

用 户 可 以 通过 rtext 来 获取 网 页 的 内 容 。 

结果 如 下 : 

"<!DOCTYPE html>\r\n<!--STATUS OK--><html> <head><meta http-equiv=content— 
type content=text/html;charset=utf-8><meta http-equiv=X-URA-Compatible 


content=IE=Edge><meta content=always name=referrer>..." 
另外 ， 还 可 以 通过 rcontent 来 获取 页 面 内 容 。 

>>> r.content 

r.content 以 字 节 的 方式 去 显示 ， 所 以 在 IDLE 中 以 b 开头 。 

>>> r.encoding # 可 以 使 用 rz.encoding 来 获取 网 页 编码 

结果 如 下 : 

tea 


当 发 送 请 求 时 ，requests 会 根据 HTTP 头 部 来 获取 网 页 编码 ; 当 使 用 rtext 时 ，requests 
使 用 这 个 编码 。 当 然 ， 用 户 还 可 以 修改 requests 的 编码 形式 。 
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>>> r=requests.get('http://www.zhidaow.com') 
>>> r.encoding 

1 8 

>>>r .encoding="'ISO-8859-1" 


像 上 面 的 例子 ， 对 encoding 修改 后 直接 用 修改 后 的 编码 去 获取 网 页 内 容 。 

©@ JSON 

如 果 用 到 JSON， 就 要 引入 新 模块 ， 例 如 json 和 simplejson， 但 在 requests 中 已 经 有 了 
内 置 的 函数 rjson()。 这 里 以 查询 IP 的 API 为 例 : 


>>>r=requests.get ('http://ip.taobao.com/service/getIpInfo.php?ip= 
ZRLO6r 2 

>>> r.json() 

"qata’: 1"region 1d": "410000”, "counEy: "XX "city id’: "410100", 
TareanR econtry" 中国 veountEry id" "CNM "Tsp "于 商 网 Waread lar: 
vey p22 rodiony :np spa 
OORT Conty Hs My, Moe LOL 

>>>r.json()['data']['country'] 

"中 国 ， 
@ 网 页 状态 码 

用 户 可 以 使 用 rstatus_code 来 检查 网 页 的 状态 码 。 


>>>r=requests.get ('http://www.mengtiankong .com') 


>>>r.status code 

200 

>>>r=requests.get ('http://www.mengtiankong.com/123123/') 
>>>r.status code 


404 
此 时 ， 能 正常 打开 网 页 的 返回 200， 不 能 正常 打开 的 返回 404。 
@ 响应 的 头 部 内 容 


用 户 可 以 通过 rheaders 来 获取 响应 的 头 部 内 容 。 


>>>T=requests.get('http://www-zhidaow.com') 

>>> r.headers 

{ 
'content-encoding': 'gzip', 
'transfer-encoding': 'chunked', 
'content-type': 'text/html; charset=utf-8"'; 


} 


可 以 看 到 以 字典 的 形式 返回 了 全 部 内 容 ， 用 户 也 可 以 访问 部 分 内 容 。 


>>> r.headers['Content-Type'] 
'tezxt/html; charset=utf-8" 
>>> r.headers.get ('content-type') 
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'text/html; charset=utf-8" 


@ 设置 超时 时 间 


就 会 提示 错误 。 


>>> requests.get('http://github.com'，timeout=0.001) 
Traceback (most recent call last): 

File "<stdin>", line 1, in <module> 
requests.exceptions.Timeout: HTTPConnectionPool (host='github.com', 
port=80): Request timed out. (timeout=0.001) 


@ 代理 访问 
在 采集 时 为 避免 被 封 卫 ， 经 常会 使 用 代理 。requests 也 有 相应 的 proxies 属性 。 


import requests 


proxies={ 
NEED “htop /LO LUO S12 
Mhttps™ “hutpe/ll0lo T0000 
} 
requests.get ("http://www.zhidaow.com", proxies=proxies) 


如 果 代 理 需 要 账户 和 密码 ， 则 需要 这 样 : 


proxies={ 
http "http /userspass@l0.10.1.10:3128/", 


} 
请 求 头 内容 可 以 用 rrequest.headers 来 获取 。 


>>>r .request .headers 


{'Accept-Encoding': 'identity, deflate, compress, gzip', 


户 可 以 通过 timeout 属性 设置 超时 时 间 ， 一 旦 超过 这 个 时 间 还 没有 获得 响应 内 容 ， 


'Accept': '*/*', 'User-Agent': 'python-requests/1.2.3 CPython/2.7.3 Windows/XP"'} 


人 @@ 自 定义 请 求 头 部 
伪装 请 求 头 部 是 怜 虫 采集 信息 时 经 常用 到 的 ， 用 户 可 以 用 这 个 方法 来 隐藏 自己 : 


>>>r=requests.get ('http://www.zhidaow.com') 


>>>print (r.request.headers['User-Agent']) # 输 出 python-requests/2.13.0 


>>>headers={'User-Agent': 'xmj'} 
>>>r=requests.get ('http://www.zhidaow.com', headers=headers) 

# 伪 装 的 请 求 头 部 
>>>print (r.request.headers['User-Agent'] ) # 输 出 xzmj， 避 免 被 反 息 虫 


再 例如 另 一 个 定制 header 的 例子 : 


import requests 
import json 
data={'some': '"'data'} 
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headers={'content-type': 'application/json', 
'User-Agent': 'Mozilla/5.0(X1ll; Ubuntu; Linux x86 64; rv:22.0) 
Gecko/20100101 Firefox/22.0'} 
r=requests.post('https://api.github.com/some/endpoint', data=data, 
headers=headers) 


print (r.text) 
下 面 用 requests 库 蔡 换 urllib 库 , 并 用 open().write() 方 法 替换 掉 urllib.request.urlretrieve 
(url, localPath) 方 法 来 下 载 中 原 工 学 院 主页 上 的 所 有 图 片 。 


使 用 requests、bs4 库 下 载 中 原 工学 院 主页 上 的 所 有 图 片 


import os 
import requests 
from bs4 import BeautifulSoup 
def getHtmlCode (url): # 该 方法 传 入 url1， 返 回 url 的 html 的 源 代码 
headers={ 
'User-Agent': 'MMozilla/5.0(Windows NT 6.1; WOW64; rv:31.0) Gecko/ 
20100101 Firefox/31.0' 
} 
r=requests.get (url,headers=headers) 
Fr.encoding='UTF-8" # 指 定 网 页 解析 的 编码 格式 
page=r .text # 获 取 url 页 面 的 源 代码 字符 串 文 本 


return page 


def getImg (page, 1ocalPath) : 间 该 方法 传 入 html 的 源 代码 ， 截 取 其 中 的 img 标签 ， 将 图 
# 片 保存 到 本 机 
if not os.path.exists (localPath) :  # 新 建文 件 夹 
os .mkdir (localPath) 
soup=BeautifulSoup (page, 'html .parser') # 按 照 html 格式 解析 页 面 


imgList=soup.find all('img') # 返 回 包含 所 有 img 标签 的 列表 
x=0 
for imgUrl in imgList: # 列 表 循 环 

ey 


print (' 正 在 下 载 : $s'%imgUrl.get('src')) 
if "http://" not in imgUrl.get('src'): # 不 是 绝对 路 径 http 开始 
m="'http://www.zut.edu.cn/'+imgUrl.get ('src') 
print (' 正 在 下 载 : $s' sm) 
ir=requests.get ('http://www.zut.edu.cn/'+imgUrl .get ('src')) 
else: 
ir=requests.get (imgUrl.get('src')) 
# 用 write () 方法 写 入 本 地 文件 中 
open (localPath+'sd.jpg'sx，"wb') .write(ir.content) 
Xx+=1 


except: 
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案例 开发 


从 入 门 到 实战 一 一 怜 虫 、 游 戏 和 机 器 学 习 
continue 
if _ name =="'_ main _': 


url=" http://www.zut.edu.cn/"' 
localPath="'E:/img/" 
page=getHtmlCode (url) 


getImg (page, localPath) 


掌握 上 述 技 
输入 搜狗 图 


术 后 先 疏 取 较 简单 的 搜狗 图 片 中 某 主题 的 图 片 。 
片 的 网 址 “http://pic.sogou.com/”， 进 入 壁纸 分 类 ， 然 后 按 F12 键 进入 开发 


人 员 选 项 (编者 上 


的 是 Google Chrome 浏览 器 )。 右 击 某 张 图 片 , 在 快捷 菜单 中 选择 “检查 ” 


命令 ， 结 果 如 图 


EE 
€ 了 C [picsogoucom/pi /econmend tatery me1%DANDONE et 


6-2 所 示 。 


发 现 需 要 的 


图 6-2 网 页 代码 示意 图 


图 片 是 在 img 标签 下 的 ， 于 是 先 试 着 用 Python 的 requests 提取 该 组 件 ， 进 


而 获取 img 的 src， 然 后 使 用 urllib.request.urlretrieve 逐个 下 载 图 片 ， 从 而 达到 批量 获取 资 


料 的 目的 。 疏 取 


的 URL 如 下 : 


http://pic.sogou.com/pics/recommend?category=%B1%DA%D6%BD 
此 URL 来 自 进入 分 类 后 的 浏览 器 的 地 址 栏 。 


写 出 如 下 代 


码 : 


import requests 


import urllib 


from bs4 import BeautifulSoup 


res=requests.get ('http://pic.sogou.com/pics/recommend?category= 
$B1%DASD6SBD"' ) # 扑 取 的 URL 
soup=BeautifulSoup (res.text, 'html .parser') 


print (soup.select ('img')) 


输出 : 
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[<img alt=" 搜 狗 图 片 " src="/news/images/tupian130x34 @lx.png" srcset= 
"/news/images/tupianl30x34 @2x.png 2x"/>, <img class="st-load" src=""/>] 


此 时 发 现 输出 内 容 并 不 包含 想 要 的 图 片 元 素 ， 而 是 只 剖析 到 Logo( 见 图 6-3) 的 img， 
这 显然 不 是 大 家 想 要 的 。 也 就 是 说 , 需要 的 图 片 资料 不 在 “http://pic.sogou.com/pics/recommend? 
category=- %B1%DA%D6%BD” 的 HTML 源 代码 里 面 。 
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图 6-3 tupian130x34 @1x.png 


这 是 为 什么 呢 ? 可 以 发 现 当 在 网 页 内 向 下 滑动 鼠标 滚轮 时 图 片 是 动态 刷新 出 来 的 ， 也 
就 是 说 ， 该 网 页 并 不 是 一 次 加 载 出 全 部 资源 ， 而 是 动态 加 载 资 源 。 这 也 避免 了 因为 网 页 过 
于 腾 肿 而 影响 加 载 速度 。 在 网 页 动态 加 载 中 找 出 图 片 元 素 的 方法 如 下 : 

按 F12 键 ， 在 Network 的 XHR 下 单 击 文件 链接 ， 在 Preview 选项 卡 中 观察 结果 ， 如 
图 6-4 所 示 。 


民 所 | Bements Console Sources Network Timeline Proiles Application Security Audits 


和 @ mp 了 View 三 去 Preserve log Disable cache Offline No throttling 下 


Regex 加 Hide data URLs Al | 1s css Ime Media Font poc Ws Manifest other 


| 10000ms 20000ms 30000ms 40000ms 50000ms S0000ms 70000ms s0 
Name X Headers Preview Response Cookies Timing 
癌 getAlRecomPicByTagjsp?category=%E5%6A3%581%E7%BA%B888ttag=%E {category:“ 壁 纸 "，tag:“" 全 部 "，star 


pall_items: [{id: 11984943, did: 0,.}, {id:; 
疏 纸 " 


itemsOnPage: 9 
maxEnd: 12129 


图 6-4 分 析 网 页 的 JSON 数据 


1/36 requests | 3.0KB /7.1 KB transferred | Finish: 2.3 min | DOMC. 


说 明 : XHR 的 全 称 为 XMLHttpRequest， 中 文 解释 为 可 扩展 超 文本 传输 请 求 。 其 中 ， 
XML 是 可 扩展 标记 语言 ，Http 是 超 文本 传输 协议 ，Request 是 请 求 。XMLHttpRequest 对 象 
可 以 在 不 向 服务 器 提交 整个 页 面 的 情况 下 实现 局 部 更 新 网 页 。 当 页 面 全 部 加 载 完毕 后 ， 客 
户 端 通过 该 对 象 向 服务 器 请 求 数据 ， 服 务 器 端 接收 数据 并 处 理 后 向 客户 端 反馈 数据 。 
XMLHttpRequest 对 象 提供 了 对 HTTP 协议 的 完全 访问 ， 包 括 做 出 POST 和 HEAD 请 求 以 
及 普通 的 GET 请 求 的 能 力 。XMLHttpRequest 可 以 同步 或 异步 返回 Web 服务 器 的 响应 ， 并 
且 能 以 文本 或 者 一 个 DOM 文档 的 形式 返回 内 容 。 尽 管 名 为 XMLHttpRequest, 但 它 并 不 限 
于 和 XML 文档 一 起 使 用 ， 它 可 以 接收 任何 形式 的 文本 文档 。XMLHttpRequest 对 象 是 为 
AJAX 的 Web 应 用 程序 架构 的 一 项 关键 功能 。 

单 击 图 6-4 中 的 JSON 数据 all items， 发 现下 面 是 一 个 个 貌似 图 片 的 元 素 。 试 着 打开 
一 个 URL， 发 现 确实 是 图 片 的 地 址 。 找 到 目标 之 后 单 击 XHR 下 的 Headers 得 到 : 

http://pic.sogou.com/pics/channel/getAllRecomPicByTag.jsp?category—=%ES5%A3%81%E7 
WBA%BS Rtag—=%ESY%8S%ASWE9%83%A Rstart=0&len=15&width=1536&height=864 

试 着 去 掉 一 些 不 必要 的 部 分 ， 技 巧 就 是 删 掉 可 能 的 部 分 之 后 访问 不 受 影 响 ， 最 后 得 到 
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的 URL 如 下 : 
http://pic.sogou.com/pics/channel/getAllRecomPicByTag.jsp?category=%E5%A3%81%E7 
%BA9?%B8&tag=9%0E59%085%0A89%0E99%0839%0A8&start=0&len=15 
从 字面 意思 知道 category 后 面 可 能 为 分 类 。start 为 开始 下 标 ，len 为 长 度 ， 即 图 片 的 数 


量 。 通过 这 个 URL 请 求 得 到 响应 的 JSON 数据 中 包含 着 用 户 所 需要 的 图 片 地 址 。 有 了 上 面 


的 分 析 可 以 写 出 以 下 代码 : 


import requests 

import json 

import urllib 

def getSogouImag (category, length, path): 


n=length 
Cate=category 
imgs=requests.get('http://pic.sogou.com/pics/Vchannel/ 
getAllRecomPicByTag.jsp?category='+cate+'&tag=%E5%85%A8%E9%83%$A8&start= 
Oglen="'+str (n)) 
jd=json.1oads (imgs .text) 
jd=jd['all items'] 
imgs url=[] 
Eo0r: Yn ds 
imgs url.append(j['bthumbUrl']) 
m=0 
for img url in imgs url: 
print ('***** +Str (m)+" .jpg *****'+"'Downloading*") 
urllib.request.urlretrieve (img url,path+str (m)+' .jpg') 
m=m+1 
Print('Download complete!') 


getSogouImag (' 壁 纸 ', 200, 'D:/download/ 壁 纸 /') 


# 下 载 200 张 图 片 到 D 盘 download 下 的 “壁纸 ”文件 夹 中 


程序 运行 结果 如 图 6-5 所 示 。 
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EGRODE33 


IRm emm 


4 DOF a zp 


图 6-5 疏 取 到 D 盘 download 下 “壁纸 ”文件 夹 中 的 图 片 


第 6 章 息 虫 应 用 一 一 抓 取 百度 图 片 


至 此 ， 关 于 该 怜 虫 程序 的 编程 介绍 完毕 。 从 整体 来 看 ， 找 到 需要 疏 取 元 素 所 在 的 url 
是 疏 虫 诸多 环节 中 的 关键 。 
有 了 用 搜狗 图 片 下 载 图 片 的 基础 ， 下 面 来 实现 百度 图 片 的 图 片 下 载 。 


6.4 程序 设计 的 步骤 


6.4.1 分 析 网 页 源 代码 和 网 页 结构 


进入 百度 图 片 界面 (https://image.baidu.com/)， 输 入 某 个 关键 字 ( 例 如 夏 敏捷 )， 然 后 
单 击 “ 百 度 一 下 ”按钮 搜索 ， 可 见 如 下 网 址 : 

https://image.baidu.com/search/index?tn=baiduimage&ct=201326592&lm——1&cl=2&ie=g 
bk&word=%CF%C4%C3%F4%BDY%DD&fr=ala&ala=1 &alatpl=adress&pos=0&hs=2&xthttps 
=111111 
其 中 ，%CF%C4%C3%F4%BD%DD 就 是 “ 夏 敏捷 ”的 URL 编码 (网 址 上 不 使 用 汉字 )， 
所 看 见 的 页 面 是 “瀑布 流 版 本 ”( 如 图 6-6 所 示 )， 当 向 下 滑动 的 时 候 可 以 不 停 刷新 ， 这 是 
一 个 动态 的 网 页 (和 搜狗 图 片 类 似 ， 需 要 按 F12 键 ， 通 过 Network 下 的 XHR 去 分 析 网 页 
的 结构 )， 而 用 户 可 以 选择 更 简单 的 方法 ， 就 是 单 击 网 页 右上 方 的 “传统 翻 页 版 本 ”( 如 
图 6-7 所 示 )。 


种 殖 朗 图片 .百度 接 它 。。 X 《着 psyfim 
€ 3 CC @https//image.baidu. 
洪 让 用 回 囊 XI 站 站 从 下 中 SA 名 [E 度 -下 ] 


Bai 妆 图 # | 


网 页 新 闻 贴吧 知 首 音乐 ”图片 况 须 地 图 文库 更 多 » 


口 相关 栅 索 ; ”敏捷 喜 。 何 敏捷 。 敬 撞 桩 ” 繁 接 ”敏捷 厂 。 叶 繁 接 。” 供 竹 接 。 敬重 型 赵 狐 一 。 边 繁重 。 吕 沼 捷 。 杨 敏捷 。 范 敏 接 。 吴 敬 捷 。 韩 敏 接 


wual Bonie ET 
程序 设计 艇 名 三 ~ 


图 6-6 瀑布 流 版 本 下 的 图 片 


在 传统 翻 页 版 本 下 的 浏览 器 地 址 栏 中 可 见 如 下 网 址 : 
https://image.baidu.com/search/flip?tn=baiduimage&ie=gbk&word=%CF%C4%C3%F4% 
BD%DDe&ct=201326592&lm——1&v=flip 
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诈 tpsyfimage baiducon 关于 全 百 要 让 -发现 多 名 也 界 x》 闪 页 St 珀 加 H 失 于 。 x 人 


政 熏 &ct=201326592&ic=08dm=-18&width=&lZ 
洪 应 用 国 建 网 千 门 从 正中 SS 入 党 后 放下 ] 多 网 归 日 HTMLS 中 硬 : 直 国 乒 。 站 洲 从 大 学 出 版 入 族 蜗 。 入 车 睹 昔 沫 网 ”[ 园 | Pythoni 二 -国有 


二 C @ https://image.baidu.com/search/flip’tn=baiduimageB&ie=utf-38word 


会 ， 


Bai 作 四 夏 束 捷 国 = 一 | 下 首页 mi 33 ” 我 站 图 此 温 本 沉 上 二 


相关 搜索 + 繁 接 套 。 何 敏 捷 ”敏捷 柱 。 敏捷 。 繁 接 大 对 敏 接 。 供 繁 接 。” 敏 二 型 。 赵 吾 汪 。 女 到 过 。 吕 各 接 。 杨 敏 接 。 范 敏 持 。 吴 敏 捷 。 韩 敏捷 


图 6-7 传统 翻 页 版 本 下 的 图 片 


在 传统 翻 页 版 本 下 单 击 “ 下 一 页 ”或 某 数字 页 码 ， 网 址 会 发 生变 化 ， 而 动态 网 页 则 


因为 其 分 页 参数 是 在 POST 请 求 中 的 。 在 该 程序 中 使 用 这 个 网 址 请 求 页 面 。 


不 


在 网 页 空白 处 右 击 选 择 “ 查 看 网 页 的 源 代码 ”命令 , 可 以 查看 网 页 的 源 代码 (如 图 6-8 
所 示 )， 也 就 是 requests get 下 来 的 数据 ， 在 这 里 面 找到 各 个 图 片 的 链接 和 下 一 页 的 链接 比 
较 困 难 。 


EEL 


ocript 
T72 /记录 而 面 开始 时 间 


3 window page3tartTine = hew Dare0 
T4 window sexollTo (0, 上 
175| </sceapt》 
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图 6-8 ”传统 翻 页 版 本 下 的 图 片 


户 可 以 通过 浏览 器 (例如 Chrome) 的 开发 者 工具 来 查看 网 页 的 元 素 ， 按 F12 键 打 


开 开 发 者 工具 来 查看 网 页 样式 ， 注 意 当 鼠标 从 结构 表 中 滑 过 时 会 实时 显示 此 段 代 码 所 对 应 
的 位 置 区 域 ( 注 意 先 要 单 击 开发 者 工具 右上 角 的 箭头 按钮 用 户 可 以 通过 此 方法 快速 地 找 


到 图 


片 元 素 所 对 应 的 位 置 ( 如 图 6-9 所 示 )。 
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sd bdstatic .con/79cFunsl 
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Sendtth:180prheight:l88pxitop:gprileft:96pXi" t= "net 入 
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图 6-9 图 片 元 素 所 对 应 的 位 置 


对 图 6-9 分 析 可 知 ， 每 个 图 片 都 在 <ul class="imglist"> 下 的 列表 项 <li class="imgitem" 
style="width:372px;"> 中 ， 其 中 <img sre="..."> 保 存 图 片 的 网 址 。 


1 


<div id="imgid"> 
<ul class="imglist"> 
<1i class="imgitem" style="width:372px;"> 
<a target=" blank" 
<img src="https://ss0.bdstatic.com/70cFuHSh QlYnxGkpoWK1lHF6hhy/it/ 


u=3577097530, 1691750734&amp; fm=27&amp; gp=0.jpg”alt="net 程序 设计 教程 "> 


</a> 
<div class="hover" title="net 程序 设计 教程 /<strong> 夏 敏捷 </strong> 
等 "></div> 
</1i> 


从 上 面 找到 了 一 张 图 片 的 路 径 : 

https://ss0.bdstatic.com/70cFuHSh QlYnxGkpoWK1HF6hhy/it/u=3577097530,16917507 
34&amp;fm=27&amp;gp=0.jpg 

用 户 可 以 在 HIML 源 代 码 中 搜索 此 路 径 找到 它 的 位 置 ， 如 下 : 


flip.setData('"imgData'v 

{ "queryEnc":"%E5%A4%8F%E6%95%8F%E6%8D$B7", "displayNum":5722, "bdIsClustered" : 
mm. ESERNUnns 9 "barmtDispHum® < "5722”. "DdSearchTime™ ls ww 
"isNeedAsyncRequest":0, 

"data": [{"thumbURL": "https://ss0.bdstatic.com/70cFuHSh 
QlYnxGkpoWK1HF6hhy/it/u=3577097530, 1691750734&fm=27&gp=0.jpg", 
"middleURL":"https://ss0.bdstatic.com/70cFuHSh QlYnxGkpoWK1lHF6hhy/it/u= 
3577097530, 1691750734&fm=27&gp=0.jpg", "largeTnImageUrl":"", "hasLarge" :0, 
"hoverURL":"https://ss0.bdstatic.com/70cFuHSh QlYnxGkpoWK1HF6hhy/it/u= 
3577097530,1691750734&fm=27&gp=0.jpg", "pageNum":0, 

"objURL": "http://imgl3.360buyimg.com/n0/jfs/t586/241/26929280/71476/ 
2c65610c/54484fe6Nb33010bd.jpg", 

"fromURL":"ippr Zz2C$qAzdH3FAZdH3Ftpj4 z&e3B31 z&e3Bv54AzdH3F8nc9adan0n 


ZzZ&e3Bip4s", "fromURLHost":"item.jd.com", "currentIindex":"", "width":800, 
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"height":800, "type":"jpg", "filesize":"", “bdSrcType™:"0", 
mdi":"35266154990™; “pi™:"0", "is":"0,0", "partnerIid":0, "bdSetImgNum":0; 
"bdImgnewsDate":"1970-01-01 08:00", 


可 见 “thumbURL”“middleURL” 和 “objURL” 均 是 图 片 的 所 在 网 址 ， 
“objURL” 对 应 的 网 址 图 片 ， 所 以 写 出 如 下 正则 表达 式 获取 图 片 的 所 在 网 址 : 


re.findall('"objURL":"(.*?)"',content, re.S) 


过 分 析 可 知 ,“ 下 一 页 ”或 某 数字 页 码 HTML 的 代码 如 下 : 


<div id="page"> 


里 选用 


<strong><span class="pc">1</span></strong> 

<a href="/search/flip?tn=baiduimage&ie=utf-8&word=$E5%A4%8F%E6%95%8F%$E6%8D%B7 
&pn=20&gsm=3c&ct=&ic=0&lm=-1&width=0&height=0"><span class="pc" data="right"> 
2</span></a> 

<a href="/search/flip?tn=baiduimage&ie=utf-8&word=$E5%A4%8F%$E6%95%8F%E6%8D%B7 
&pn=40&gsm=0&ct=&ic=0&1m=-1&width=0&height=0"><span class="pc" data= 
"right">3</span></a> 

<a href="/search/flip?tn=baiduimage&ie=utf-8&word=%E5%A4%8F%E6%95%8F%E6%8D%B7 
&pn=180&gsm=0&ct=&ic=0&1m=-1&width=0&height=0"><span class="pc" data= 
"right">10</span></a> 

<a href="/search/flip?tn=baiduimage&ie=utf-8&word=%E5%A4%8F%E6%95%8F%E6%8D%B7 
&pn=20&gsm=3c&ct=&ic=0&lm=-l1&width=0&height=0" class="n"> 下 一 页 </a> 
</div> 


所 以 获取 “下 一 页 ”链接 写 出 如 下 正则 表达 式 : 


re.findall('<div id="page">.*<a href="(.*?)" class="n">',content, re.Ss) [0] 


6.4.2 ”设计 代码 


Python 怜 虫 搜索 百度 图 片 库 并 下 载 图 片 的 代码 如 下 : 


import requests ## 首 先导 入 库 视频 讲解 

import re 

# 设 置 默 认 配 置 

MaxSearchPage=20 # 搜 索 页 数 

CurrentPage=0 # 当 前 正在 搜索 的 页 数 

DefaultPath="pictures" # 默 认 储存 位 置 

NeedSave=0 # 是 否 需 要 储存 

# 图 片 链接 正则 和 下 一 页 的 链接 正则 

def imageFiler (Content) : # 通 过 正则 获取 当前 页 面 的 图 片 地 址 数组 
return re.findall('"objURL":"(.*?)"',content, re.s) 

def nextSource (Content) : # 通 过 正则 获取 下 一 页 的 网 址 


next=re.findall('<div id="page">.*<a href="(-*?)" class="n">"', 


content, re.s) [0] 


| 136 


第 6 章 爬虫 应 用 一 一 抓 取 百 度 图 片 


print("—=—-————— "+"http://image.baidu.com"+next) 
return next 
# 恺 虫 主体 
def spidler(source) : 
Content=requests .get (source) .text # 通 过 链接 获取 内 容 
imageArr=imageFiler (Content) # 获 取 图 片 数 组 
global CurrentPage 
print ("Current page:"+str (CurrentPage)+"****** 站 让 ** 让 让 让 水" ) 
for imageUrl in imageArr: 
print (imageUr1) 
global NeedSave 


if NeedSave: # 如 果 需 要 保存 图 片 则 下 载 图 片 ， 否 则 不 下 载 图 片 
global DefaultPath 
Ery: 


# 下 载 图 片 并 设置 超时 时 间 ， 如 果 图 片 地 址 错误 就 不 继续 等 竺 了 


picture=requests.get (imageUr]l, timeout=10) 


except: 
print ("Download image error! errorUrl:"+imageUrl) 
continue 

# 创 建 图 片 保存 的 路 径 

imageUrl=imageUrl .replace('/','') .replace(':',''). 


replace('?','') 
pictureSavePath=DefaultPath+imageUrl 
fp=open (pictureSavePath, 'wb') # 以 写 入 二 进 制 的 方式 打开 文件 
fp.write (picture.content) 
fp.close() 
global MaxSearchPage 
if CurrentPage<=MaxSearchPage: # 继 续 下 一 页 爬 取 
if nextSource (Content) : 
CurrentPage+=1 
和 疏 取 完毕 后 通过 下 一 页 地 址 继续 疏 取 
spidler ("http://image.baidu.com"+nextSource (Content) ) 
# 疏 虫 的 开启 方法 
def beginSearch (page=l, save=0, savePath="pictures/"): 
# (page :有 爬 取 页 数 , save :是 否 储存 , savePath: 默 认 储存 路 径 ) 
global MaxSearchPage,NeedSave,DefaultPath 


MaxSearchPage=page 
NeedSave=save # 是 否 保存 ， 值 为 0 不 保存 ，1 保存 
DefaultPath=savePath # 图 片 保存 的 位 置 


key=input ("Please input you want search: ") 
StartSsource="http://image.baidu.com/search/flip?tn= 
baiduimage&ie=utf-8&word="+str (key)+"&ct=201326592&v=flip" 

埋 分 析 链 接 可 以 得 到 ， 蔡 换 其 "word" 值 后 面 的 数据 来 搜索 关键 词 
spidler(StartSource) 


# 调 用 开启 的 方法 就 可 以 通过 关键 词 搜索 图 片 了 
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beginSearch (page=5, save=1) #page=5 是 下 载 前 5 页 ，save=1 为 保存 图 片 


运行 后 输入 搜索 关键 词 ， 例 如 “ 夏 敏捷 ”， 可 以 在 pictures 文件 夹 下 得 到 夏 敏捷 的 相关 


图 片 ， 如 图 6-10 所 示 。 这 里 下 载 的 图 片 的 命名 采用 的 是 下 载 


的 网 址 ， 所 以 需要 去 除 文件 名 


不 允许 的 特殊 字符 ， 例 如 “: ”“/”“?” 等。 当然 ,更 好 的 处 理 方法 是 文件 名 采用 数字 编号 ， 


避免 网 址 中 出 现 特殊 字符 。 


二 网 ， (区 14 丰 ) Pythor 直 扣子 项 上 要 迪夫 Pyhon 妆 这 浊 】 ， pkures 


Hm 

EE 

hepg-ectimeges meson commage O2880O¢- Cetalogsht2010113780040lFOVGQ 01 omanipg 

rnpimgo02 21nimg camphotorailbum20150511m6005C25578C2hECDHF4324EAEEBCAFO1SCjpeg 

hapime ae2 deimg en1091291525892-1.2 2ipg 

避 hrpimgl360bwmimgcomngjfa58624126329280714762c85610c54434fe6Nb33010bdjpg 

hping14350buyipng comaGd1273309728568970109843d71s1v0550b853blN692.3537jpg 
eco 


a 
imgcn1091293525892- 太吉 = 区 招 才 各 网 $ + 
i We Fa » 800 Ss Ss 


图 6-10 ”pictures 文件 夹 下 得 到 相关 图 
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7.1 itchat 功能 介绍 


本 程序 运行 后 会 出 现 一 张 二 维 码 图 片 ， 微 信用 户 通过 微 信 扫 描 二 维 码 
登录 自己 的 微 信 ， 此 时 如 果 有 好 友 发 过 来 信息 ， 则 微 信 机 器 人 会 自动 回复 好 友 ， 效 果 如 
图 7-1 所 示 。 在 该 图 中 可 以 看 到 当 好 友 发 过 来 “你 好 吗 ” 微 信 机 器 人 会 自动 回复 “还 不 错 ， 
你 呢 ” 当 好 友 发 过 来 “ 讲 个 笑话 吧 ”， 微 信 机 器 人 会 自动 回复 一 个 笑话 ， 当 好 友 问 “郑州 


天 气 ? ”时 ， 微 信 机 器 人 会 自动 回复 天 气 情况 ， 等 等 。 


< 夏 坡 拓 1 


wm 病 
sur 国 


国 snours, reen. 


wm 国 


了 郑州 : 周 六 ,多 云 转 小 雨 东北 风 微 风 ， 
最 低 气 温 2 度 ， 最 高 气温 11 度 


| 


国 :nsrsssasas, ant 
办 和平 .第 一 次 世界 大 战 抽 间 ， 德 
国 的 椅 领 和 十 兵 经 常 出 入 巴黎 的 毕 
加 索 艺术 馆 ， 在 艺术 馆 的 出 口 处 ， 
毕 加 素 发 给 每 个 德国 军人 一 幅 他 的 
名 画 ( 丫 尔 尼 卡 》 的 复制 品 ， 这 模 


晶 还 不 错 ,你 呢 


由 


7-1 微 信 机 器 人 聊天 效果 


| De 项 目 案 例 开 发 
从 入 门 到 实战 一 一 假 虫 、 游 戏 和 机 器 学 习 


7.2 程序 设计 的 思路 


该 程序 需要 用 到 一 个 Python 库 一 一 itchat，itchat 是 一 个 开源 的 微 信 个 人 账号 的 接 
可 以 使 用 该 库 进行 微 信 网 页 版 中 的 所 有 操作 ; 另外 还 需要 用 到 图 灵机 器 人 API， 图 灵 术 


器 


人 是 一 个 中 文 语 境 下 的 对 话机 器 人 。 本 章 主要 使 用 itchat 库 和 图 灵机 器 人 API 完成 一 个 能 


够 处 理 微 信 消 息 的 图 灵机 器 人 ， 包 括 好 友 聊 天 、 群 聊天 。 


7.3 ”关键 技术 
7.3.1 安装 itchat 


itchat 是 一 个 开源 的 微 信 个 人 账号 的 接口 ， 使 得 Python 调用 微 信 功能 从 未 如 此 简章 


折 


FE, 


用 户 使 用 不 到 三 十 行 的 代码 就 可 以 完成 一 个 能 够 处 理 所 有 信息 的 微 信 机 器 人 .itchat 库 已 经 


做 好 了 用 代码 调用 微 信 的 大 多 数 功能 ， 使 用 起 来 非常 方便 ， 官 方 技术 文档 的 网 


-为 


“http://itchat.readthedocs.io/zh/latest/”， 用 户 在 使 用 时 需要 安装 itchat 库 ， 在 安装 的 时 候 使 用 


pip 即 可 。 


pip install itchat 


7.3.2 itchat 的 登录 微 信 


运行 以 下 代码 ， 会 出 现 一 张 图 7-2 所 示 的 二 维 码 ， 扫 码 登 录 之 后 将 会 给 “文件 传输 助 


手 ” 发 送 一 条 “Hello, filehelper” 的 消息 。 


图 7-2 二 维 码 
import itchat # 加 载 itchat 库 
itchat.auto login() # 登 录 微 信 


# 发 送 文本 消息 ， 发 送 目标 是 “文件 传输 助手 ” 


itchat.send('Hello, filehelper', toUserName='filehelper') 
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7.3.3 itchat 的 消息 类 型 


itchat 支持 所 有 的 消息 类 型 与 群 聊 。 在 itchat 中 定义 了 文本 、 图 片 、 名 片 、 位 置 、 通 知 、 
分 享 、 文 件 等 多 种 消息 类 型 ， 可 以 分 别 执行 不 同 的 处 理 。 下 面 的 示例 注册 了 一 个 消息 响应 
事件 ， 用 来 定义 接收 到 文本 消息 后 如 何 处 理 。 

import itchat 

# 注 册 消 息 响应 事件 ， 消 息 类 型 为 itchat .content .TEXT， 即 文本 消息 ， 把 装饰 器 写成 下 面 的 形 

# 式 即 可 

Q@itchat.msg register (itchat.content .TEXT) 


def text reply (msg): 
# 返 回 同样 的 文本 消息 


return msg['Text'] 


itchat.auto login() # 登 录 微 信 
# 绑 定 消息 响应 事件 后 让 itchat 运行 起 来 ， 监 听 消 息 


itchat.run() 
itchat.content 中 包含 所 有 的 消息 类 型 参数 ， 如 表 7-1 所 示 。 
表 7-1 itchat.content 中 所 有 的 消息 类 型 参数 


参数 类 型 Text 键 值 
TEXT 文本 文本 内 容 (文字 消息 ) 
MAP 地 图 位 置 文本 (位 置 分 享 ) 
CARD 名 片 推荐 人 字典 (推荐 人 的 名 片 ) 
SHARING 分 享 分 享 名 称 〔 分 享 的 音乐 或 者 文章 等 ) 
PICTURE 图 片 /表情 下 载 方法 
RECORDING 语音 下 载 方法 
ATTACHMENT 附件 下 载 方法 
VIDEO 小 视频 下 载 方法 
FRIENDS 好 友 邀 请 添加 好 友 所 需 参数 
SYSTEM 系统 消息 更 新 内 容 的 用 户 或 群 聊 的 UserName 组 成 的 列表 
NOTE 通知 通知 文本 〈 消 息 撤回 等 ) 


比如 需要 存储 发 送 给 自己 的 附件 : 
@itchat.msg register (ATTACHMENT) 
def download files (msg): 
msg['Text'] (msg['FileName']) 
msg 字典 的 Text 键 是 个 下 载 方法 (函数 )， 可 以 下 载 文件 。 
再 来 看 如 何 处 理 其 他 类 型 的 消息 ， 可 以 在 消息 响应 事件 里 把 msg 打印 出 来 ， 它 是 一 个 
字典 ， 看 有 哪些 感 兴趣 的 字段 。 下 面 演示 了 对 这 些 消 息 类 型 的 简单 处 理 。 
import itchat 
from itchat.content import * #import 全 部 消息 类 型 
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# 处 理 文本 类 消息 ， 包 括 广 本、 位置、 名 片 、 通 知 、 分 享 

@itchat.msg register([TEXT, MAP, CARD, NOTE, SHARING]) 

def text reply(msg): 
# 微 信里 的 每 个 用 户 和 群 聊 都 使 用 ID 来 区 分 ，msg['FromUserName' ] 就 是 发 送 者 的 ID 
# 将 消息 的 类 型 和 文本 内 容 返 回 给 发 送 者 


itchat.send('%s: $s' $ (msg['Type'], msg['Text']), msg['FromUserName']) 


# 处 理 多 媒体 类 消息 ， 包 括 图 片 、 录 音 、 文 件 、 视 频 
@itchat.msg register([PICTURE, RECORDING, ATTACHMENT, VIDEO]) 
def download files (msg): 
#msg['Text'] 是 一 个 文件 下 载 函 数 ， 传 入 文件 名 ， 将 文件 下 载 下 来 
msg['Text'] (msg['FileName']) 
# 把 下 载 好 的 文件 再 发 给 发 送 者 
return '@%s@%s' $ ({'Picture':'img','Video':'vid'}.get (msg['Type'], 
'fil'), msg['FileName']) 


# 处 理 好友 添 加 请 求 ， 收 到 好 友 邀 请 自动 添加 好 友 

Qitchat.msg register (FRIENDS) 

def add friend (msg) : 
itchat.add friend (*+*msg['Text']) # 该 操作 会 自动 将 新 好 友 的 消息 录入 ， 不 需要 重 载 通讯 录 
# 加 完好 友 后 给 好 友 打 个 招呼 


itchat.send msg('Nice to meet You!'，msg['RecommendInfo']['UserName']) 


# 处 理 群 聊 消 息 ， 在 注册 时 增加 isGroupchat=True 将 判定 为 群 聊 回 复 
Qitchat.msg register (TEXT, isGroupChat=True) 
def text reply(msg): 
if msg['isAt']: 
itchat.send(u'@%s\u2005I received: %s' % (msg['ActualNickName'], 
msg ['Content']), msg['FromUserName']) 


# 在 auto_login () 里 面 提供 一 个 True， 即 hotReload=True 

# 即 可 保留 登录 状态 ， 即 使 程序 关闭 ， 在 一 定时 间 内 重新 开启 也 可 以 不 重新 扫 码 
itchat.auto login (True) 

itchat.run() 


在 PICTURE、RECORDING、ATTACHMENT、VIDEO 几 类 的 msg 字典 的 Text 键 下 


FileName 键 中 。 
区 分 群 聊 消息 还 是 与 好 友 聊 天 ， 在 注册 时 增加 isGroupChat=True 将 判定 为 群 聊 回 复 。 
例如 注册 @itchat.msg_register(TEXT，isGroupChat=True) 将 判定 为 群 聊 回 复 ， 而 注册 


@itchat.msg_register(TEXT) 将 判定 为 与 好 友 聊 天 。 


值得 注意 的 是 ， 群 消息 增加 了 3 个 键 值 : 


isat: 判断 是 否 8 本 号 自己 ; ActualNickName: 实际 NickName; Content :信息 内 容 
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可 以 通过 以 下 程序 测试 : 
import itchat 
from itchat.content import TEXT 
Qitchat.msg register (TEXT, isGroupChat=True) 
def text reply (msg): 
if (msg.isAt): # 判 断 是 否 有 人 @ 自 己 
坦 如 果 有 人 人 @ 自 己 ， 就 发 一 个 消息 告诉 对 方 已 经 收 到 了 信息 
itchat.send msg ("我 已 经 收 到 了 来 自 {0} 的 消息 ， 实 际 内 容 为 {1}".format (msg 
['ActualNickName'],msg['Text']),toUserName=msg['FromUserName']) 
print (msg.isRt) # 输 出 True 或 False 
print (msg.actualNickName) 
print (msg.text) 
itchat.auto login() 
itchat.run() 


7.3.4 itchat 回复 消息 


itchat 提供 了 5 种 回复 方法 ， 建 议 用 户 直 接 使 用 send0 方 法 。 


@ send0 方 法 
格式 : 
send (msg= 'Text Message', toUserName=None) 


。msg: 发 送 消息 的 内 容 ， '@fi@ 文 件 地 址 将 会 被 识别 为 传送 文件 ，'@img@ 图 片 地 
址 ' 将 会 被 识别 为 传送 图 片 ，'@vid@ 视 频 地 址 ' 将 会 被 识别 为 传送 小 视频 。 

。 toUserName: 发 送 对 象 ， 如 果 留 空 将 会 发 送 给 自己 。 

返回 值 : 

发 送 成 功 为 True， 失 败 为 False。 

程序 示例 : 

import itchat 

itchat.auto login() 

itchat.send('Hello world!') 

# 请 确保 该 程序 目录 下 存在 gz .gif、xlsx.xlsx 和 demo.mp4 文件 

itchat.send('@img@%s' %$ 'gz.gif') 

itchat.send('@fil@%s' 当 'xlsx.xlsx') 

itchat.send('@vid@%s' $%$ 'demo.mp4') 


四 send_msg0 方 法 
格式 : 


send msg (msg="'Text Message', toUserName=None) 


参数 : 
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。 msg: 消息 内 容 。 

。 toUserName: 发 送 对 象 ， 如 果 留 空 将 会 发 送 给 自己 。 
返回 值 : 

发 送 成 功 为 True， 失 败 为 False。 

程序 示例 : 


import itchat 


N 


itchat.auto login() 
itchat.send msg('Hello world') 


全 send_file0 方 法 
格式 : 


send file(fileDir, toUserName=None) 


参数 : 

。 fileDir: 文件 路 径 〈 不 存在 该 文件 时 将 打印 无 此 文件 的 提醒 )。 
。 toUserName: 发 送 对 象 ， 如 果 留 空 将 会 发 送 给 自己 。 

返回 值 : 

发 送 成 功 为 Te， 失败 为 False。 

程序 示例 : 

import itchat 

itchat .auto login() 

# 请 确保 该 程序 目录 下 存在 xLsx.x1sx 文件 


itchat.send file('xlsx.xlsx') 

@ send_img0 方 法 

格式 : 

send img (fileDir, toUserName=None) 

参数 : 

。 fileDir: 文件 路 径 〈 不 存在 该 文件 时 将 打印 无 此 文件 的 提醒 )。 
。 toUserName: 发 送 对 象 ， 如 果 留 空 将 会 发 送 给 自己 。 


返回 值 : 
发 送 成 功 为 Tue， 失 败 为 False。 
程序 示例 : 


itchat.send img('gz.gif') 


全 send_ video0 方 法 
格式 : 


send video (fileDir, toUserName=None) 

。 fileDir: 文件 路 径 〈 不 存在 该 文件 时 将 打印 无 此 文件 的 提醒 )。 
。 toUserName: 发 送 对 象 ， 如 果 留 空 将 会 发 送 给 自己 。 

返回 值 : 
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发 送 成 功 为 Te， 失败 为 False。 
程序 示例 (需要 保证 发 送 的 视频 为 一 个 实际 存在 的 MP4 文件 ): 
itchat.send file('demo.mp4') # 请 确保 该 程序 目录 下 存在 demo .mp4 文件 


7.3.5 itchat 获取 账号 


在 使 用 个 人 微 信 的 过 程 中 主要 有 3 种 账号 需要 获取 , 分 别 为 好 友 、 公众 号 、 群 聊 。itchat 
为 这 3 种 账号 提供 了 整体 获取 方法 与 搜索 方法 ， 而 群 聊 多 出 获取 用 户 列表 的 方法 以 及 创建 
群 聊 、 增 加 和 删除 用 户 的 方法 。 这 里 分 别 介绍 这 3 种 账号 的 使 用 方法 。 

和 @ 好 友 

好 友 的 获取 方法 为 get_friends(), 将 会 返回 完整 的 好 友 所 组 成 的 列表 , 其 中 每 个 好 友 为 
一 个 字典 ,列表 的 第 1 项 为 本 人 的 账号 信息 ， 如 果 传 入 update 参数 为 True， 可 以 更 新 好 友 
列表 并 返回 。 

下 面 是 某 个 好 友 的 字典 信息 : 

{'OwnerUin': 0, 'AppAccountFlag': 0, 'DisplayName': ''，'KeyWord': ' 

'IsOwner': 0,'EncryChatRoomId': ''，'NickName': ' 富 兰 克 林 '，'UniFriend': 0， 

'ContactFlag': 3, 'Province': ' 上 海 '， 'RemarkPYInitial': 'FLKLFBK', 

"UserName': '@bef3be95365d187525526e8f4al85cb0d06de5385d8c2b6d9a705ed39 

e691c88'，'HeadImgUr1': '/cgi-bin/mmwebwx-bin/webwxgeticon?seq=636140456& 

username=@bef3be95365d187525526e8f4al85cb0d06de5385d8c2b6d9a705ed39e691 
c88&skey=@crypt 4a30791b 8487e5all7a9ec8b721lccfdl7fe7da2f', 'Signature': 

' 范 本 已 '，'PYQuanPin': 'fulankelin', 'Sex': 1, 'SnsFlag': 49, 'Attrstatus': 

33788221，'MemberCount': 0，'VerifyFlag': 0，'RemarkName': ' 富 兰 克 林 范 本 恺 '， 

"PYInitial': 'FLKL', 'RemarkPYQuanPin': 'fulankelinfanbenkai', 'City': '', 

yin Or "NomDerpistr <Contactiiste [>> ALiasu es votarEriond, Oy 

'ChatRoomId': 0, 'Statues': 0, 'HideInputBarFlag': 0} 

从 中 可 以 得 到 好 友 的 省 份 (' Province ')、 用 户 ID (CUserName')、 性 别 ('Sex', 值 1 表 
示 男 ) 等 信息 。 

好 友 的 搜索 方法 为 search_friends()， 其 有 4 种 搜索 方法 : 

1) 仅 获取 自己 的 用 户 信息 


itchat .search friends () # 获 取 自 己 的 用 户 信息 ， 返 回 自己 的 属性 字典 
2) 获取 特定 UserName 的 用 户 信息 


# 获 取 特 定 UserName 的 用 户 信息 
itchat.search friends (userName='@abcdefg1234567') 


3) 获取 备注 、 微 信号 、 昵 称 中 的 任何 一 项 等 于 name 键 值 的 用 户 
# 获 取 任 何 一 项 等 于 name 键 值 的 用 户 


itchat .search friends (name="littlecodersh') 
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字典 ， 传 入 update 参数 为 True 将 可 以 更 新 公众 号 列表 并 返回 。 


字典 ， 传 入 update 参数 为 True 将 可 以 更 新 群 聊 列表 并 返 


从 入 门 到 实战 一 一 爬虫 、 游 戏 和 机 器 学 习 

4) 获取 备注 、 微 信号 、 昵 称 分 别 等 于 相应 键 值 的 用 户 

# 获 取 分 别 对 应 相应 键 值 的 用 户 

itchat .search_ friends (wechatAccount='littlecodersh') 

第 3 种 和 第 4 种 方法 可 以 一 起 使 用 ， 下 面 是 示例 程序 : 

itchat.search friends (name='LittleCoder 机 器 人 '，wechatAccount="'1littlecodersh') 
四 公众 号 

公众 号 的 获取 方法 为 get_mps0, 将 会 返回 完整 的 公众 号 列表 ,其 中 每 个 公众 号 为 一 个 


公众 号 的 搜索 方法 为 search_ mps0， 其 有 两 种 搜索 方法 : 

1) 获取 特定 UserName 的 公众 号 

# 获 取 特 定 UserName 的 公众 号 ， 返 回 值 为 一 个 字典 

itchat .search _ mps (userName=" Qabcdefgl1234567") 

2) 获取 名 字 中 含有 特定 字符 的 公众 号 

# 获 取 名 字 中 含有 特定 字符 的 公众 号 ， 返回 值 为 一 个 字典 的 列表 

itcaht.search mps (name='LittleCoder') 

如 果 两 项 都 做 了 特定 ， 将 会 仅 返 回 特定 UserName 的 公众 号 ， 下 面 是 示例 程序 : 
# 以 下 方法 相当 于 仅 特定 了 UserName 

itchat.search mps (userName="'@abcdefg1234567', name='LittleCoder') 
(3 二 da 

群 聊 的 获取 方法 为 get_chatrooms()， 将 会 返回 完整 的 群 聊 列表 ， 其 中 每 个 群 聊 为 一 个 


El 


群 聊 的 搜索 方法 为 search_chatrooms()， 共有 两 种 搜索 方 法 : 
1) 获取 特定 UserName 的 群 聊 


# 获 取 特 定 UserName 的 群 聊 ， 返 回 值 为 一 个 字典 
itchat. search chatrooms (userName=" @abcdefgl1234567') 


2) 获取 名 字 中 含有 特定 字符 的 群 聊 
# 获 取 名 字 中 含有 特定 字符 的 群 聊 ， 返 回 值 为 一 个 字典 的 列表 


itcaht.search chatrooms (name="'LittleCoder') 
如 果 两 项 都 做 了 特定 ， 将 会 仅 返 回 特定 UserName 的 群 聊 ， 下 面 是 示例 程序 : 


# 以 下 方法 相当 于 仅 特 定 了 UserName 
itchat. search chatrooms (userName=" @abcdefg1234567', name='LittleCoder') 


群 聊 用 户 列表 的 获取 方法 为 update_chatroom()， 群 聊 在 首次 获取 中 不 会 获取 群 聊 的 


户 列表 ， 所 以 需要 调用 该 方法 才能 获取 群 聊 的 成 员 ， 该 方法 需要 传 入 群 聊 的 UserName， 


返 


回 特定 群 聊 的 用 户 列表 。 
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memberList=itchat .update chatroom('@abcdefgl1234567') 


创建 群 聊 以 及 增加 、 删 除 群 聊 用 户 的 方法 如 下 ， 目 前 这 3 个 方法 都 被 严格 限制 了 使 


频率 ， 删 除 群 聊 需 要 本 账号 为 群 管理 员 ， 否 则 会 失败 。 


memberList=itchat .get friends() [1:] 

# 创 建 群 聊 ，topic 键 值 为 群 聊 名 

chatroomUserName=itchat .create chatroom (memberList, 'test chatroom') 
# 删 除 群 聊 内 的 用 户 

itchat .delete member from chatroom(chatroomUserName, memberList[0]) 
# 增 加 用 户 进入 群 聊 


itchat .add member into chatroom(chatroomUserName, memberList[0]) 


7.3.6 itchat 的 一 些 简单 应 用 


和 @ 统计 微 信 好 友 的 男女 比例 
如 果 想 统计 一 下 自己 微 信里 的 好 友 的 性 别 比例 ， 很 简单 ， 获 取 好 友 列 表 ， 统 计 列 表 里 


的 性 别 计数 。 


import itchat 
itchat.1login() 
# 疏 取 自 己 好 友 的 相关 信息 ， 返回 一 个 好 友 列 表 
friends=itchat.get friends (update=True) [0:] 
# 初 始 化 计数 器 ， 有 男 有 女 ， 当 然 可 能 有 些 人 没 填写 性 别 
male=female=other=0 
#friends [0] 是 自己 的 信息 ， 所 以 要 从 friends [1] 开 始 
for i in friends[1:] :# 遍 历 这 个 列表 ， 列 表 中 的 第 1 位 是 自己 ， 所 以 从 "自己 "之 后 开始 计算 
sex=i["Sex"] 
if sex==1: #1 表示 男性 ，2 表示 女性 
male+=1 
elif sex==2: 
female+=1 
else: 
other +=1 
# 计 算 朋 友 总 数 
total=len (friends[1:]) 
# 打 印 出 自己 好 友 的 性 别 比例 
print ("男性 好 友 : %$.2f%%"% (float (male) /total*100)+"\n"+ 
"女性 好 友 : $.2f%%"%s(float (female) /total*100)+"\n"+ 
"不 明 性 别 好 友 : $.2f%%"% (float (other) /total* 100)) 


这 好 像 不 够 直观 ， 有 兴趣 的 读者 可 以 加 上 可 视 化 展示 , 这 里 用 基于 Python 的 可 视 化 图 


像 库 Matplotlib， 首 先 安装 Matplotlib 库 : 


pip install matplotlib 
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从 入 门 到 实战 一 一 爬虫 、 游 戏 和 机 器 学 习 


展示 比例 一 般 使 用 百分比 圆 饼 表 : 


import numpy as np 

# 导 入 Matplotlib 库 

import matplotlib.mlab as mlab 
import matplotlib.pyplot as plt 
labels=['"'man','female', 'unknow'"] 


X=[ male, female, other] 
fig=plt.figure() 
plt.pie(X,1labels=labels,autopct="'%1 .2f%%") 
# 夯 饼 图 数据， 数据 对 应 的 标签 ， 百 分 数 保留 两 位 小 数 点 ) 
plt.title ("Pie chart") 
plt.show() 
plt.savefig ("PieChart.jpg") 


其 运行 效果 如 图 7-3 所 示 。 
| es 寺 | 
| 
| Pie chart 
| man 
用 
| 
ES aa yor | 


图 7-3 微 信 好 友 的 男女 比例 饼 图 
@ 统计 微 信 好 友 的 所 在 省 份 信息 到 Excel 文件 中 


def get Var (Var) : 
variable=[] 
for i in friends: 
value=i [var] 
variable.append (value) 
return variable 
# 调 用 函数 得 到 各 变量 ， 并 把 数据 存 到 csv 文件 中 
NickName=get var ("NickName") 
Sex=get varl('Sex') 
Province=get var('Province') 
City=get var('city') 
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Signature=get var('Signature') 

from pandas import DataFrame 

data={'NickName': NickName, 'Sex': Sex, 'Province': Province, 
'City': City, 'Signature': Signature} 

frame=DataFrame (data) 

frame.to csv('data.csv', index=True) 


全 微 信 自动 回复 
这 里 实现 一 个 类 似 QQ 上 的 自动 回复 ， 原 理 是 接收 到 消息 就 发 消息 回去 ， 同 时 发 一 条 
给 文件 助手 ， 这 样 就 可 以 在 文件 助手 中 统一 查看 消息 。 其 代码 很 简单 ， 如 下 : 
# 微 信 自动 回复 
import itchat 
from itchat.content import * 
# 封 装 好 的 装饰 器 ， 当 接收 到 的 消息 是 Text〔 即 文字 消息 ) 时 
Qitchat.msg register('Text') 
def text reply (msg): 
# 当 消息 不 是 由 自己 发 出 的 时 候 
if not msg['FromUserName']==myUserName: 
# 发 送 一 条 提示 给 文件 助手 
itchat.send msg (u"[%s] 收 到 好 友 @%s 的 信息 : ss\n" % 
(time. strftime ("%Y-%m-%d %H:%M:%S", time.localtime (msg['CreateTime'])), 
msg['User']['NickName'],msg['Text']), 'filehelper') 


# 回 复 给 好 友 
return u' [自动 回复 ] 我 现在 不 在 ,一 会 再 和 您 联系 。\n 已 经 收 到 您 的 信息 :$s\n'% (msg['Text']) 


if _ name =='_ main _': 
itchat.auto login() 
# 获 取 自 己 的 UserName 
myUserName=itchat .get friends (update=True) [0] ["UserName"] 
itchat.run() 


@ 收 到 红包 提醒 


import itchat 
from itchat.content import * 
# 微 信 红 包 提醒 
Qitchat .msg register (NOTE,isGroupChat=True) # 监 听 群 内 红包 消息 NOTE 
def receive red packet (msg): 
if u" 收 到 红包 " in msg['Content']: 
groups=itchat .get chatrooms (update=True) 
users=itchat .search chatrooms (name='Happy 一 家 人 ' ) # 把 红包 消息 通知 给 这 个 群 
userName=users[0] ['UserName'] # 获 取 这 个 群 的 唯一 标识 ID 
for g in groups: 


if msg['FromUserName'] == gl['UserName']: 
根据 群 消息 的 FromUserName 匹配 是 哪个 群 
group_ name=g['NickName'] # 群 的 昵称 
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we 项 目 案例 开发 
从 入 门 到 实战 一 一 仆 虫 、 游 戏 和 机 器 学 习 
msgbody=' 有 人 在 群 "$s" 发 了 红包 ,请 立即 打 电 话 给 我 , 让 我 去 抢 '$group_name 
# 提 醒 自 己 有 人 在 群 里 发 红包 
itchat.send (msgbody, toUserName=myUserName) 
# 把 红包 消息 通知 给 'Happy 一 家 人 ' 群 
itchat.send (msgbody, toUserName=userName) 
itchat.auto login (True) 
# 获 取 自 己 的 UserName 
myUserName=itchat .get friends (update=True) [0] ["UserName"] 
itchat.run() 


7.3.7 Python 调用 图 灵机 器 人 API 实现 简单 的 人 
机 交互 


图 灵机 器 人 是 一 个 中 文 语 境 下 的 对 话机 器 人 ， 免 费 的 机 器 人 允许 每 天 ”之 ?时 称 : 
有 5000 次 的 调用 ， 如 果 放 在 群 聊 中 是 完全 够 用 的 (只 有 @ 的 消息 才 使 用 机 ”国民 二 
器 人 回复 )。 图 灵机 器 人 还 有 一 些 简 单 的 能 力 ， 例 如 讲 笑话 、 故 事 大 全 、 成 。 ”视频 讲解 
语 接龙 、 新 闻 资 讯 等 。 如 果 有 好 友 发 送 “ 讲 个 笑话 吧 ”， 它 就 会 自动 回复 一 
个 笑话 ; 如果 好 友 问 “郑州 天 气 ? ” 它 就 会 自动 回复 天 气 情况 ， 等 等 。 

下 面 介绍 如 何 简 单 地 调用 图 灵机 器 人 接口 (API)。 

@ 注册 获取 APIKEY 

这 一 步 很 简单 ， 在 “http:/wwwtuling123.com” 对 应 的 网 页 上 直接 注册 一 个 账号 ， 就 
可 以 得 到 自己 的 机 器 人 APIKEY。 这 个 APIKEY 在 以 后 发 送 GET 请 求 的 时 候 需 要 用 到 。 
如 果 用 户 觉得 很 麻烦 ， 也 可 以 暂时 使 用 itchat 提供 的 几 个 KEY。 

8edce3ce905a4cldbb965e6b35c3834d 

eb720a8970964f3f855d863d24406576 


1107d5601866433dba9599faclbc0083 
71f28bf79c820df10d39b4074345ef8c 


四 安装 requests 实现 HTTP 请 求 

在 安装 的 时 候 使 用 pip 即 可 。 

pip install requests 

全 调用 图 灵机 器 人 接口 

其 调用 也 比较 简单 ， 主 要 是 模拟 POST 请 求 ， 然 后 解析 返回 的 JSON 数据 。 用 户 可 以 
使 用 requests， 也 可 以 使 用 urllib 库 ， 但 request 简化 了 发 送 HTTP 请 求 的 步骤 。 


ee 


import requests 

import urllib 

import json 

KEY="e5ccc9c7c8834ec3b08940e290ff1559" 井 换 成 自己 的 RPI KEY 
url="http://www.tulingl123.-com/openapi/api'" 

req_info=' 讲 个 笑话 ' -encode ('utf-8') 
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query={'key': KEY，"info': req info} 
headers={"'Content-type': "text/html'， "charset': 'utf-8'} 


方法 一 : 用 requests 模块 以 GET 方式 获取 回复 内 容 。 


req=requests.get (url, params=query, headers=headers) 
response=req.text 

data=j son.loads (response) 

print (data.get ('text')) # 或 者 data['text'] 


方法 二 : 用 urllib 库 获 取 回 复 内 容 。 


data=parse.urlencode (query) .encode ('"utf-8")# 使 用 urlencode () 方法 转换 标准 格式 
page=request .urlopen (url,data) 


El 


html=page. read () 


html=html .decode ("utf-8") #decode () 将 网 页 的 信息 进行 解码 ， 和 否则 会 出 现 乱码 
data=json.loads (html) #JSON 字典 数据 

print (data) # 显 示 字典 数据 

print (' 机 器 人 说 : '+ data.get('text')) 井 显示 对 话 内 容 


下 面 是 实现 在 Python 的 控制 台 下 与 图 灵机 器 人 聊天 的 例子 : 


import urllib,json 
from urllib import request 
from urllib import parse 
def getHtml (url, data): 
page=request .urlopen (url,data) 
html=page.read() 
html=html .decode ("utf-8") ”#decode () 将 网 页 的 信息 进行 解码 ， 否 则 会 出 现 乱码 


return html 


if _ name =='_ main _': 
key="'8b005db5f57556fb96dfd98fbccfab84"' 
#url='http://www.tulingl23.com/openapi/api?key="' + key + '&info='+ info 
url="'http://www.tulingl23.com/openapi/api' 
while True: 
req_info=input (' 我 :') 
# 发 给 服务 器 数据 
query={'key': key, 'info': req info} 
data=parse.urlencode (query) .encode ('utf-8') 
## 使 用 urlencode () 方法 转换 标准 格式 
Fresponse=getHtml (url, data) 


data=json.1oads (response) # 字 典 数据 
print (data) # 显 示 字 典 数 据 
print (' 机 器 人 : '+data['text'] ) 井 显示 对 话 内 容 
运行 结果 如 下 : 
我 : he 


{'code': 100000, 'text"': "他 ?5 
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从 入 门 到 实战 一 一 疏 虫 、 游 戏 和 机 器 学 习 

机 器 人 说 : 他 

我 : 讲 个 笑话 

{'code': 100000，"text' : "北京 的 城管 也 是 蛮 拼 的 。 夜 里 十 二 点 多 ， 路 边 买 个 饼 吃 ， 钱 都 交 
了 ， 卖 饼 的 阿姨 被 城管 吓 跑 了 "1} 

机 器 人 说 : 北京 的 城管 也 是 蛮 拼 的 。 夜 里 十 二 点 多 ， 路 边 买 个 饼 吃 ， 钱 都 交 了 ， 卖 饼 的 阿姨 被 城管 吓 跑 了 


7.4 程序 设计 的 步骤 


读者 掌握 了 以 上 关键 技术 ， 就 可 以 轻松 开发 微 信 机 器 人 了 。 
# 加 载 库 


from itchat.content import * 


import requests 
import json 

import itchat 
itchat.auto login() 


调用 图 灵机 器 人 的 API， 采 用 扑 虫 的 原理 ， 根 据 聊天 消息 返回 回复 内 容 。 


def tuling(info) : 
appkey="e5ccc9c7c8834ec3b08940e290ff1559" 
url="http://www.tulingl23.com/openapi/api?key=%s&info=%s"% (appkey, info) 
req=requests.get (url) 
content=req.text 


6 


data=json.loads (content) 
answer=data['text'] 
return answer 


对 于 群 聊 信 息 ， 定 义 获取 想 要 针对 某 个 群 进行 机 器 人 回复 的 群 D 函数 。 


def group id (name) : 
df=itchat .search chatrooms (name=name) 
return df[0] ['UserName'] 


注册 itchat 文本 消息 ， 绑 定 到 text_reply0 处 理 函 数 。 


#text reply msg files 可 以 处 理 好 友之 间 的 聊天 回复 
@itchat.msg register ([TEXT,MAP, CARD,NOTE,SHARING]) 
def text reply(msg): 
itchat.send('%s' % tuling(msg['Text']),msg['FromUserName']) 


注册 多 媒体 消息 ， 绑 定 到 download files0 处 理 函 数 。 


Qitchat.msg register([PICTURE, RECORDING, ATTACHMENT, VIDEO] ) 
def download files (msg) : 
msg['Text'] (msg['FileName']) 


return '@%s@%s' $ ({'Picture': 'img', 'Video': 'vid'}.get (msg['Type'], 
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'fil'), msg['FileName']) 


现在 微 信用 户 通常 加 了 很 多 群 ， 但 并 不 想 对 所 有 的 群 都 设置 微 信 机 器 人 ， 只 想 对 某 些 
群 设置 微 信 机 器 人 ， 可 进行 如 下 设置 : 


Qitchat.msg register (TEXT, isGroupChat=True) 


def group text reply (msg): 
# 如 果 只 想 对 @ 自 己 的 人 回复 ， 可 以 设置 if msg['isAt'] 
item=group id(u' 想 要 设置 的 群 的 名 称 ') # 根 据 自己 的 需求 设置 


if msg['FromUserName']==item: 


itchat.send(u'%s' $ tuling(msg['Text']), item) 


itchat.run() 


这 个 机 器 人 会 自动 回复 好 友和 群 聊 信 息 ， 并 将 发 来 的 图 片 等 多 媒体 信息 下 载 下 来 重新 


对 方 。 


7.5 ”开发 消息 同步 机 器 人 


有 了 开发 微 信 聊 天 机 器 人 的 经 验 之 后 ， 接 下 来 开发 微 信 消 息 同步 机 器 人 ， 微 信 消 息 同 
步 机 器 人 用 于 完成 两 个 群 信息 的 同步 〈 当 任意 一 个 群 收 到 消息 时 同步 到 其 他 另 一 个 群 )。 
其 开发 思路 是 设计 一 个 字典 groups， 用 来 存放 需要 同步 消息 的 群 聊 的 ID， 其 中 key 为 
群 聊 的 ID，value 为 群 聊 的 名 称 。 

groups={' 群 聊 的 ID' : 和 群 聊 的 名 称 ，' 群 聊 的 ID ': 群 聊 的 名 称 } 


理 ， 


例如 : 


groups={"'@f47fcf4533413b5fad998e30459a86866623c68cb6a363c7aeff208ec03fb 


b8d'，'Happy 一 家 人 ' 


» ef47fcf4533413b5fad998e30459a86866623c68cb6a363c7aeff 


208ec03fbb8d，' 神 聊 谷 '} 


当 接收 到 群 聊 消息 时 
同时 转发 到 其 他 需要 
首先 定义 一 个 消息 响 


， 如 果 消 息 来 自 于 需要 同步 消息 的 群 聊 ， 就 根据 消息 类 型 进行 处 
同步 的 群 聊 。 
应 函数 ， 文 本 类 消息 可 以 用 TEXT 和 SHARING 两 类 ， 使 用 


isGroupChat=True 指定 消息 来 自 于 群 聊 ， 这 个 参数 默认 为 False。 


import itchat 


from itchat.content import * 
@itchat.msg register([TEXT, SHARING], isGroupChat=True) 
def group reply text (msg): 

# 获 取 群 聊 的 ID， 即 消息 来 自 于 哪个 群 聊 


source=msg['FromUserName'] # 群 聊 的 ID 


# 这 里 可 以 把 source 
groups={"'@f47fcf 


打印 出 来 ， 在 确定 是 哪个 群 聊 后 把 群 聊 的 ID 和 名 称 加 入 groups 
4533413b5fad998e30459a86866623c68cb6a363c7aeff208ec03 


fbb8d', ' Happy 一 家 人 ', @f47fcf4533413b5fad998e30459a86866623c68cb6a363c7 


aeff208ec03fbb8d. 


，' 神 聊 谷 '} 
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# 处 理 文本 消息 
if msg['Type']==TEXT: 
# 消 息 来 自 于 需要 同步 消息 的 群 聊 
if source in groups:# 济 断 是 否 在 字典 里 ， 等 价 于 2 .7 版 本 中 的 groups-has_key(source) 
for item in groups.keys() : # 转 发 到 其 他 需要 同步 消息 的 群 聊 


if not item==source: 
#groups[source] : 消息 来 自 于 哪个 群 聊 
#msg['ActualNickName'] : 发 送 者 的 名 称 
#msg['Content '] : 文本 消息 内 容 
#item: 需要 被 转发 的 群 聊 ID 
itchat.send('%$s: ss\ngss' 当 (groups[source], msg['ActualNickName'], 
msg['Content']), item) 
# 处 理 分 享 消息 
elif msg['Type']==SHARING: 
if groups.has key(source) : 
for item in groups.keys() : 
if not item==source: 
#msg['Text']: 分 享 的 标题 ,msg['Url']: 分 享 的 链接 
itchat.send('%s: $s\n%ss\n%s' %$ (groups[source], msg['ActualNickName'], 
msg['Text'], msg['Url']), item) 


再 来 处 理 一 下 图 片 等 多 媒体 类 消息 。 


# 处 理 图片 和 视频 类 消息 
Qitchat.msg register([PICTURE, VIDEO], isGroupChat=True) 
def group reply media (msg): 
source=msg['FromUserName'] 
井下 载 图 片 或 视频 
msg['Text'] (msg['FileName']) 
if groups.has key(source) : 
for item in groups .keys() : 
if not item==source: 
# 将 图 片 或 视频 发 送 到 其 他 需要 同步 消息 的 群 聊 
itchat.send('@%s@%s' % ({'Picture': 'img', 'Video': 'vid'}.get (msg['Type'], 
'fil'), msg['FileName']), item) 
itchat.auto login (True) 
itchat.run() 


以 上 代码 实现 了 对 文本 、 分 享 、 图 片 、 视 频 4 类 消息 的 处 理 ， 如 果 用 户 对 其 他 类 型 的 


消息 也 感 兴趣 ， 进 行 相应 的 处 理 即 可 。 目 前 两 个 群 之 间 可 以 进行 消息 的 同步 了 ， 一 群 和 二 
群 的 用 户 之 间 终 于 可 以 畅快 地 聊 起 来 。 


8.1 微 信 网 页 版 机 器 人 功能 介绍 


微 信 网 页 版 是 腾讯 公司 开发 的 微 信 官方 工具 ， 能 够 在 计算 机 网 页 上 使 用 微 信 


， 微 信 网 


页 版 基于 Https 请 求 ， 通 过 API 的 形式 与 微 信服 务 器 进行 数据 交互 ， 所 有 的 协议 均 暴露 ， 


可 通过 浏览 器 抓 包工 具 进 行 获取 和 分 析 。 


目前 国内 流行 的 浏览 器 (例如 Chrome 浏览 器 、FireFox 浏览 器 ) 均 带 有 开发 者 工具 ， 
用 户 通 过 网 络 请 求 面板 可 以 详细 地 看 到 整个 微 信 网 页 版 在 运行 过 程 中 涉及 的 所 有 API 请 


求 。 本 章 根据 上 述 获 取 到 的 请 求 模拟 微 信 网 页 版 的 流程 。 
首先 对 微 信和 网 页 版 的 整体 运行 流程 进行 分 析 , 使 用 Python 语言 模拟 微 信 网 页 


版 的 运行 


流程 ， 实 现 登 录 、 获 取 好 友信 息 、 发 送 消息 等 基础 操作 ， 并 在 上 述 基 础 之 上 实现 一 些 扩展 
操作 ， 例 如 自动 确认 好 友 请 求 、 定 时 发 送 消息 、 检 测 好 友 状 态 、 自 动 邀 请 好 友 加 入 群 聊 等 。 


通过 对 微 信 网 页 版 协议 进行 分 析 ， 读 者 对 API 中 的 请 求 参 数 、 请 求 方式 、 返 


回 值 等 加 


深 了 理解 ， 这 对 后 续 的 实际 开发 有 很 多 值得 借鉴 的 地 方 ; 能 够 清晰 地 了 解 微 信 网 页 版 的 整 
体 运行 流程 ， 扩 展 自己 的 思维 。 另 外 ， 在 扩展 个 人 微 信号 的 同时 也 能 很 好 地 练习 Python 基础 ， 


这 对 学 习 网 络 爬 虫 等 有 很 大 的 帮助 意义 。 


8.2 ” 微 信 网 页 版 机 器 人 设计 思路 
8.2.1 分 析 微 信 网 页 版 API 


本 章 以 Chrome 浏览 器 为 例 讲解 如 何 抓 包 分 析 微 信 网 页 版 API， 步 又 如 下 : 


| 这 项 目 案例 开发 

从 入 门 到 实战 一 一 仆 虫 、 游 戏 和 机 器 学 习 

@ 打开 开发 者 工具 

首先 打开 Chrome 浏览 器 ， 然 后 打开 开发 者 工具 ， 如 图 8-1 所 示 。 


女 | 图 加 


将 页 面 存储 为 .. 3%S 
清除 浏览 数据 .… | 勇 切 | 复制 | 粘贴 | 
展 程序 


bp 


图 8-1 打开 开发 者 工具 


切换 到 Network 界面 ， 如 图 8-2 所 示 。 


图 8-2 切换 到 Network 界面 


色 选 Preserve log 复 选 框 ， 否 则 在 跳 转 之 后 无 法 查看 之 前 的 请 求 信 息 。 


提示 : 对 于 Chrome 开发 者 工具 的 使 用 小 技巧 ， 读 者 可 以 在 网 址 “http://blog.csdn.net/ 


Letasian/article/details/78461438” 对 应 的 页 面 中 查看 。 
四 打开 微 信 网 页 版 


在 浏览 器 中 输入 网 址 (https://wx.qq.com)， 打 开 微 信 网 页 版 。 在 左 侧 URL 列表 
看 到 以 jslogin 开始 的 网 址 ， 该 URL 即 为 获取 登录 所 需 二 维 码 的 API 请 求 。 


Ph 可 以 


在 图 8-3 中 ， 左 侧 为 所 有 的 请 求 ， 单 击 某 一 个 请 求 后 右 侧 会 出 现 该 请 求 的 详细 信息 。 

General 中 为 请 求 的 URL (Request URL) 和 请 求 方式 (Request Method)， 常 见 的 请 求 
方式 有 GET 和 POST。Response Headers 为 响应 头 信息 ，Request Headers 为 请 求 头 信息 ， 
包括 常用 的 User-Agent、Host、Referer、Cookie 等 ，Query String Parameters 为 请 求 URL 


中 的 参数 信息 。 
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图 8-3 ”分析 URL 


单 击 右 侧 的 Response 标签 ， 可 以 看 到 格式 如 “window.QRLogin.code=200: window. 
QRLogin.uuid=" QZNW7ISPLg 一 ";” 的 内 容 ， 其 中 window.QRLogin.code 代表 该 请 求 发 送 
成 功 ，window.QRLogin.uuid 中 的 内 容 为 当前 登录 所 需要 的 二 维 码 信息 ， 将 该 uuid 传 入 获 
取 二 维 码 的 URL 中 即 可 获取 到 二 维 码 的 图 片 。 

@ ^PI 总 结 

根据 上 述 过 程 可 以 得 知 该 URL(https://login.wx.qq.com/jslogin?appid=wx782c26e4c19ac 
ffb&redirect_uri=https%3A%2F%2FWwx.qq.com%2Fcgi-bin%2Fmmwebwx-bin%2Fwebwxnewl 
oginpage&fun=new&lang=zh CN& =1521355811687) 即 为 获取 登录 所 需 二 维 码 的 API， 请 
求 方式 为 GET， 其 中 参数 列表 中 的 appid 为 微 信 开 放 平 台 注册 的 应 用 的 AppID,“_” 为 当 
前 时 间 的 13 位 毫秒 值 。 

其 余 参 数 均 固定 ， 如 下 。 


e redirect uri: https://wx.qq.com/cgi-bin/mmwebwx-bin/webwxnewloginpage。 


e fun: new。 

。 lang: zh_CN。 

注 : appid 就 是 在 微 信 开 放 平 台 注册 的 应 用 的 AppID。 网 页 版 微 信 有 两 个 AppID， 早 
期 的 是 wx782c26e4c19acfftb， 在 微 信 客户 端 上 显示 的 应 用 名 称 为 Web 微 信 ;现在 用 的 是 
wxeb7ec651dd0aefa9， 显 示 的 名 称 为 微 信 和 网 页 版 。 

根据 上 述 分 析 ， 可 以 将 此 API 归纳 为 表 8-1。 


表 8-1 获取 登录 所 需 的 二 维 码 
获取 登录 所 需 的 二 维 码 

https://login.wx.qq.com/jslogin 
GET 
appid: wx782c26e4c19acffb 
Tedirect_uri: https://wx.qq.com/cgi-bin/ mmwebwx-bin/webwxnewloginpage 
fun: new 
lang: zh CN 
= 时 间 玲 
window.QRLogin.code=200; window.QRLogin.uuid="0ZOD 53KKw—"; 
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on 项 目 案例 开发 


从 入 门 到 实战 一 疏 虫 、 游 戏 和 机 器 学 习 
其 余 API 的 分 析 方 法 与 之 类 似 ， 此 处 不 再 一 一 介绍 。 


8.2.2 API 汇总 


下 面 API 列表 中 的 参数 均 为 举例 ， 在 实际 运行 中 很 多 都 是 动态 的 ， 需 要 用 户 自 定义 传 
入 ， 返 回 值 也 为 样 例 ， 对 于 部 分 过 长 的 有 删 减 ， 不 再 一 一 指出 。 


@ 显示 一 维 码 
显示 二 维 码 如 表 8-2 所 示 。 
表 8-2 显示 二 维 码 
描述 显示 二 维 码 
地 址 https://login.weixin.qq.comyqrcode/{fuuid} 
请 求 类 型 GET 
请 求 参 数 无 
返回 值 图 片 二 进 制 流 


@ 等 待 扫描 一 维 码 
等 待 扫描 二 维 码 如 表 8-3 所 示 。 


表 8-3 等 待 扫描 二 维 码 
等 待 微 信 手 机 客户 端 扫描 二 维 码 


https://login.wx.qq.com/cgi-bin/mmwebwx-bin/login 


GET 


loginicon: true 


[a 
应 


Uuid: XXXX 

tip: 0 为 未 扫描 ，! 为 已 扫描 

I: (-940126109)， 毫 秒 值 取 反 

_: 1494054830403， 时 间 惟 

window.code=xxx; 

xxx: 408 表示 登录 超时 ，201 表示 扫描 成 功 ，200 表示 确认 登录 

当 code 为 200 时 数据 包括 跳 转 地 址 ， 例 如 “window.redirect_uri="https://wx2.qq. 
com/cgi-bin/mmwebwx-bin/webwxnewloginpage?ticket=AwglwtXTXfw9oQgP9jslV lig@ 
i 需要 将 ticket 参 


@ 登录 获取 Cookie 
登录 获取 Cookie 如 表 8-4 所 示 。 


描 述 
地 址 
请 求 类 型 


表 8-4 登录 获取 Cookie 
登录 成 功 后 获取 Cookie 信息 
https://wx2.qq.com/cgi-bin/mmwebwx-bin/webwxnewloginpage 
GET 
ticket: AwglwtXTXfw9oQgP9jslV1lig(@qrticket 0 
uid: 4AVCtDVBOg— 
lang: zh CN 
scan: 1494055480 
fun: new 
Version: V2 
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登录 成 功 后 获取 Cookie 信息 


续 表 


<error> 
<ret>0</ret> 
<message></message> 
<skey>@crypt_522d8a57 60a7646e99d8f25b230</skey> 
<wxsid>VOXSzwUSINcrbor8</wxsid> 
<wxuin>2929094227</wxuin> 
<pass_ ticket>aGK4HWSoVzFoQscFt2hO%2Fy</pass_ticket> 
<isgrayscale>1</isgrayscale> 

</error> 


人 @ 微 信和 初始 化 
微 信 初 始 化 如 表 8-5 所 示 。 


表 8-5 微 信 初 始 化 
微 信 初 始 化 

https://wx2.qq.com/cgi-bin/mmwebwx-bin/webwxinit 
POST 

JSON 

Content-Type: application/jso 
BaseRequest: { Uin: xxx, Sid: xxx, Skey: xxx, DeviceID: xxx } 
} 

{ 


charset=UTF-8 


"BaseResponse": { "Ret": 0, "ErrMsg": "" }, 
"Count": 11, 
"ContactList": [...], 
"SyncKey": { 
"Count": 4, 
"List": [ 
人 
"KEey 1 
"Val": 635705559 


}, 

Jer 
"Uin": xxx, 
"UserName": xxx, 
"NickName": xxx, 


}， 


"ChatSet": xxx, 


"SKey": xxx, 
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pe 项 目 案例 开发 
从 入 门 到 实战 一 一 爬虫 、 游 戏 和 机 器 学 习 


描述 微 信 初 始 化 


"ClientVersion": 369297683, 
"SystemTime": 1453124908, 
"TnviteStartCount": 40, 
"MPSubscribeMsgCount": 2, 
"MPSubscribeMsgList": [...], 
"ClickReportInterval": 600000 


El 
证 


@ 开启 手机 状态 通知 
开启 手机 状态 通知 如 表 8-6 所 示 。 


表 8-6 ”开启 手机 状态 通知 


描述 开启 手机 微 信 客 户 端 状 态 通知 
地 址 https://wx2.qq.com/cgi-bin/mmwebwx-bin/webwxstatusnotify 


请 求 类 型 POST 
参数 类 型 JSON 


请 求 头 Content-Type: application/json: charset=UTF-8 
: 
BaseRequest: { Uin: xxx, Sid: xxx, Skey: xxx, DeviceID: xxx }, 
Code: 3, 

请 求 参 数 FromUserName: 自己 的 ID， 


ToUserName: 自己 的 了 DD， 
ClientMsgId: 时 间 惟 


} 
加 "BaseResponse": {"Ret": 0,"ErrMsg": ""}, 
返回 数据 "MsgID": "1848761205298770623" 
@ 获取 联系 人 列表 


获取 联系 人 列表 如 表 8-7 所 示 。 
表 8-7 ”获取 联系 人 列表 


描 述 获取 联系 人 列表 
地 址 https://wx2.qq.com/cgi-bin/mmwebwx-bin/webwxgetcontact 
请 求 类 型 POST 
参数 类 型 JSON 
请 求 头 Content-Type: application/json; charset=UTF-8 
{ 
请 求 参数 BaseRequest: { Uin: xxx, Sid: xxx, Skey: xxx, DeviceID: xxx} 
了 
"BaseResponse": { 
"Ret": 0, 
"ErMsg": ™" 
返回 数据 } 


"MemberCount": 334, 
"MemberList": [ 


"Uin": 0, 
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续 表 
获取 联系 人 列表 


"UserName": XXX. 
"NickName": "Urinx", 


数据 


扎 


J 
"Seq":0 


@ 获取 指定 联系 人 详细 信息 
获取 指定 联系 人 详细 信息 如 表 8-8 所 示 。 


表 8-8 获取 指定 联系 人 详细 信息 


描述 获取 指定 联系 人 详细 信息 
地 址 https://wx2.qq.comy/cgi-bin/mmwebwx-bin/webwxbatchgetcontact 
请 求 类 POST 
JSON 


i Content-Type: application/json; charset=UTF-8 
{"BaseRequest": { 
"Uin": 2929094227, 
"Sid": "VOXSzwUSINcrbor8", 
"Skey": "@crypt_522d8a57_68f25b230", 
"DeviceID": "e586776133027541" 


此 
二 全 类 "Count": 1, 
请 求 参 数 "List": [ 
{ 
"UserName": "(0591768165ac0c9b8326bbe1355", 
"EncryChatRoomId": "@@62ea4eba9ecd4a8111327b7cb" 
} 
] 
{ 
"BaseResponse": { 
"Ret": 0, 
"ErMsg": "" 
}, 
"Count": 1, 
"ContactList": [ 
{ 
和 "Uin": 0, 
返回 数据 "UserName": "(059176816542bb0c9b8326bbe1355", 
"NickName": "路 人 甲 ", 
"HeadImgUrl": "/cgi-bin/mmwebwx-bin/webwxgeticon?seq=0&username= 
@591755&chatroomid=(@6a8f2&skey=", 
"ContactFlag": 0, 
] 
yy 
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hon 项 目 案例 开发 


从 入 门 到 实战 一 一 爬虫 、 游 戏 和 机 器 学 习 


@ 检查 新 消息 
检查 新 消息 如 表 8-9 所 示 。 


表 8-9 检查 新 消 
检查 新 消息 


https://webpush2.weixin.qq.com/cgi-bin/mmwebwx-bin/synccheck 
GET 

JSON 

Content-Type: application/json; charset=UTF-8 


{ 
BaseRequest: { Uin: xxx, Sid: xxx, Skey: xxx, DeviceID: xxx } 


window.synccheck={retcode:"xxx",selector:"xxx"} 

retcode: 0 为 正常 ，1100 表示 失败 /退出 微 信 ; 1101 表示 在 其 他 地 方 登录 Web 版 微 信 ; 
1102 表示 在 手机 上 主动 退出 

selector: 0 为 正常 ，2 表示 新 的 消息 ;6 表示 联系 人 信息 变更 ;7 表示 进入 /离开 聊天 界面 


@ 获取 新 消息 
获取 新 消息 如 表 8-10 所 示 。 


表 8-10 ”获取 新 消息 
获取 新 消息 
https://wx2.qq.com/cgi-bin/ mmwebwx-bin/webwxsync 


请 求 尖 型 “|zosT 


JSON 


{ 
BaseRequest: { Uin: xxx, Sid: xxx, Skey: xxx, DeviceID: xxx }, 
SyncKey: xxx, 
IT: 时 间 戳 取 反 

} 


{ BaseResponse': {'ErrMsg': ", 'Ret': 0}, 


'SyncKey': { 'Count': 7, 
List': [{"Val': 636214192, 'Key': 1}, ] 

} ContinueFlag': 0, 

'AddMsgCount': 1, 

'AddMsgList': [{ 
'FromUserName': ", 
'RecommendInfo': {...}, 
'Content: "", 


人 @ 发 送 文 本 消息 
发 送 文 本 消息 如 表 8-11 所 示 。 
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表 8-11 发 送 文本 消息 
发 送 文本 消息 
https://wx2.qq.com/cgi-bin/mmwebwx-bin/webwxsendmsg 
POST 
JSON 
Content-Type: application/json; charset=UTF-8 
人 


BaseRequest: { Uin: xxx, Sid: xxx, Skey: xxx, DeviceID: xxx }, 
Msg: { 
Type: 1 文字 消息 ， 
Content: 要 发 送 的 消息 ， 
请 求 参数 FromUserName: 自己 的 ID， 
ToUserName: 好 友 的 ID， 
LocalID: 与 clientMsgId 相同 ， 
ClientMsgId: 时 间 惟 左 移 4 位 随后 补 上 4 位 随机 数 
} 
= 
返回 值 {"BaseResponse": { "Ret": 0, "ErrMsg": ""}} 


@ 发 送 图 片 消息 
发 送 图 片 消 息 如 表 8-12 所 示 。 
表 8-12 发 送 图 片 消息 
发 送 图 片 消息 
https://wx2.qq.com/cgi-bin/mmwebwx-bin/webwxsendmsgimg 
POST 
JSON 
请 求 头 Content-Type: application/json; charset=UTF-8 


BaseRequest: { Uin: xxx, Sid: xxx, Skey: xxx, DeviceID: xxx }, 
Msg: { 
Type: 3 图 片 消息 ， 
Mediald: 图 片上 传 后 的 媒体 人 D， 
请 求 参数 FromUserName: 自己 的 ID， 
ToUserName: 好 友 的 ID， 
LocalID: 与 clientMsgId 相同 ， 
ClientMsgId: 时 间 改 左 移 4 位 随后 补 上 4 位 随机 数 
有 
返回 值 {"BaseResponse": { "Ret": 0, "ErrMsg 


We 
注 : 非 文 本 消息 ， 例 如 图 片 、 语 音 、 视 频 、 表 情 等 ，API 类 似 ， 均 是 先 通过 上 传 文件 获取 媒体 人 D， 
然后 发 送 此 媒体 人 D。 


人 @ 获取 头像 
获取 头像 如 表 8-13 所 示 。 
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| 光村 项 目 案例 开发 
从 入 门 到 实战 一 一 假 虫 、 游 戏 和 机 器 学 习 


表 8-13 ”获取 头像 


描述 获取 头像 
地 址 https://wx.qq.com/cgi-bin/mmwebwx-bin/webwxgeticon 
请 求 类 型 GET 
seq: 数字 
请 求 参数 usemame: 用 户 ID 
skey: XXX 
返回 值 进 制 


注 : 获取 好 友 、 群 头像 等 API 类 似 。 


图 获取 图 片 消息 
获取 图 片 消息 如 表 8-14 所 示 。 

表 8-14 ”获取 图 片 消息 
获取 图 片 消息 
https://wx.qq.com/cgi-bin/mmwebwx-bin/webwxgetmsgimg 
GET 
msgid: 消息 ID 
username: 用 户 ID 
type: slave 缩 略 图 ， 为 空 时 加 载 原 图 
skey: XXX 
- 进 制 
注 : 获取 语音 、 视 频 、 表 情 等 消息 类 似 ， 无 type 参数 。 


8.2.3 其 他 说 明 


@ 账号 类 型 介绍 
账号 类 型 如 表 8-15 所 示 。 


表 8-15 账号 类 型 
说 明 

以 “@” 开 头 ， 后 面 由 32 位 数字 和 字母 组 成 
以 “@@ 7” 开头， 后面 由 32 位 数字 和 字母 组 成 
以 “@ ”开头 ， 但 其 VerifyFlag& 8 !=0 
VerifyFlag: 

一 般 个 人 公众 号 /服务 号 : 8 

一 般 企业 的 服务 号 : 24 

微 信 官 方 账号 微 信 团队 : 56 
像 文件 传输 助手 之 类 的 账号 ， 它 们 有 特殊 的 ID， 目 前 已 知 的 有 filehelper、newsapp、 
fmessage、 weibo、 qqmail, tmessage、 qmessage、 qqsync、 floatbottle、 lbsapp、 shakeapp、 
medianote、qqfriend、 readerapp、blogapp、facebookapp、masssendapp、meishiapp、feedsapp、 
voip 、 blogappweixin 、 weixin 、 brandsessionholder 、 weixinreminder 、 officialaccounts 、 
notification messages、wxitil、userexperience_alarm、notification messages 


例如 测试 发 送 消息 ， 可 将 接收 人 〈ToUserName) 指定 为 flehelper (文件 传输 助手 ) 进 
行 测试 。 
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@ 消息 类 型 介绍 
微 信 中 消息 的 格式 一 般 如 下 : 


{ 
"FromUserName™: "™", 
"ToUserName™: "nyv 
EonEents # 内 容 
"StatusNotifyUserName": "", 
"Imgwidth": 0, 
"PlayLength": 0, 
"RecommendInfo": {...}, 
"statusNotifyCode": 4, 
"NewMsgId": "™", 
"Status™: 3 
"VoiceLength": 0, 
"ForwardFlag": 0, 
"AppMsgType": 0, 
fe 4 
REBPIaEO UseaFs 
四 
TmgStatus™: 1 
"Msgrype":. 1 
"ImgHeight": 0, 
Modlald na wh 
MgLd sn 
"FileName": ""， 
"HasProductId": 0, 
0 
"CreateTime": 1454602196, 
"SubMsgType": 0 

} 


中 经 常用 到 的 字段 有 FromUserName (发 送 人 ID)、ToUserName (接收 人 ID)、Content 
内 容 )、MsgId〈 消 息 ID )、MsgType〈 消 息 类 型 ) 等 。 微 信 中 的 部 分 消息 类 型 如 表 8-16 
所 示 。 


表 8-16 ” 微 信 中 的 消息 类 型 


系统 消息 
撤回 消息 
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从 入 门 到 实战 一 一 疏 虫 、 游 戏 和 机 器 学 习 


当 MsgType=1 时 , 用 户 只 需要 获取 Content 字段 即 可 获取 消息 内 容 , 当 MsgType=3 时 ， 
获取 Mediald 字段 ， 将 Mediald 传 入 获取 文件 接口 ， 即 可 下 载 此 图 片 消息 。 语 音 、 视 频 等 
消息 的 获取 与 此 类 似 。 


8.3 程序 设计 的 步 又 
8.3.1 微 信 网 页 版 的 运行 流程 


从 上 述 微 信 网 页 版 API 的 分 析 过 程 可 以 得 出 微 信 网 页 版 的 运行 流程 ， 如 图 8-4 所 示 。 


获取 UUID 获取 联系 人 开启 状态 通知 


! |】 
获取 二 维 码 
| 
登录 |- (人 结束 微 信 初 始 化 
. 
lL 否 
非 空 
1 
El 确认 登录 > 是 | 。 跳 转 页 面 同步 消息 


图 8-4 微 信 网 页 版 的 运行 流程 


(1) 打开 微 信 网 页 版 (https:/wx.qq.com)， 获 取 随 机 的 UUID。 

(2) 根据 第 1 步 获得 的 UUID 获取 登录 所 需 扫描 的 二 维 码 图 片 。 

(3) 使 用 微 信 移 动 客户 端 扫描 该 二 维 码 ， 检 测 用 户 是 否 已 经 扫 码 。 

(4) 扫描 二 维 码 成 功 后 ， 检 测 用 户 是 否 单 击 确认 登录 。 

(5) 确认 登录 后 ， 跳 转 新 页 面 ， 调 用 初始 化 API。 

(6) 调用 开启 手机 状态 通知 API， 获 取 联 系 人 列表 。 

(7) 循环 执行 同步 检测 ， 待 收 到 响应 后 继续 发 起 下 一 个 请 求 。 此 时 根据 返回 数据 的 内 
容 判 断 是 否 需要 拉 取 消息 、 自 动 退出 等 操作 。 

注 : 目前 微 信 网 页 版 更 新 出 账号 记录 功能 ， 用 户 在 登录 时 可 根据 之 前 的 账号 信息 实现 
免 扫 码 ， 直 接 在 微 信 移动 客户 端 单 击 确认 登录 。 本 程序 未 实现 此 功能 ， 感 兴趣 的 读者 可 以 
自行 实现 。 
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8.3.2 ”程序 目录 


本 系统 的 程序 文件 目录 如 下 : 

上 一 wechat_bot 项 目 目录 
上 一 wechat botpy ”程序 入 
上 一 thread pool 线程 相关 包 

上 一 send_ msg thread.py 发 送 消息 线程 
上 一 wechat 微 信和 相关 包 


上 一 wechat_msg processorpy 消息 处 理 

上 一 wechatpy 模拟 微 信 运行 类 继承 wechat api) 

上 一 wechat apispy ”基础 协议 (包括 所 有 API 抽象 的 函数 ) 
上 一 base ”基础 包 


上 一 config managerpy 读 取 配置 文件 
一 logpy ”日 志 
上 一 utilspy 常用 工具 
上 一 constantpy 相关 常量 
上 一 wechat.conf.bak 基础 配置 文件 
上 一 data 运行 数据 
上 一 1001 ”机 器 人 编号 
上 一 Logs 日 志 
上 一 Data 文件 
上 一 msgs 消息 
上 一 users 好 友 头像 
上 一 rooms 和 群 聊 头像 
上 一 upload 上 传 文件 
注 : 本 程序 实现 了 一 台 机 器 同时 运行 多 个 微 信 机 器 人 ， 启 动 时 使 用 如 下 命令 : 
python wechat bot.py 1001 


其 中 ，1001 为 机 器 人 编号 (数字 类 型 )， 不 同 机 器 人 的 数据 位 于 不 同 的 目录 下 。 

此 时 会 根据 wechat.conf.bak 配置 文件 的 内 容 复 制 生 成 wechat 1001.conf 文件 ， 如 果 遇 
到 部 分 机 器 人 需要 修改 配置 文件 的 内 容 ， 只 需 修 改 对 应 编号 的 配置 文件 即 可 ， 不 会 影响 其 
他 机 器 人 。 


8.3.3 微 信 网 页 版 运行 代码 的 实现 
@ 获取 随机 UUID 的 代码 


获取 随机 UUID 的 函数 包括 构造 请 求 参数 ， 使 用 Request 发 送 POST 请 求 ， 在 返回 值 
中 使 用 正则 表达 式 截 取 code 和 uuid， 并 将 uuid 设置 到 变量 中 。 
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def getuuid(self) : 


mm 


获取 登录 需要 的 UUID 


:return: True or False 


url=self.wx conf['API jsLogin'] 
params={ 间 构 造 请 求 参数 

"appid': self.appid, 

"fun': "new'v 

"Lang": self.wx conf['LANG'], 

'” 1: int(time.time()), 

"redirect uri': self.wx conf['API jslogin redirect url'], 
} 


data=post (url, params, False) # 发 送 POST 请 求 
regx=r'window.QRLogin.code=(\d+); window.QRLogin.uuid="(\S+2)"" 
pm=re.search (regx, data) # 正 则 截取 

En 


code=pm.group (1) 
self.uuid=pm.group (2) 
return code=="'200"' 
return False 
except: 
self.Log.error (traceback.format exc()) 


人 @ 结合 qrcode 生成 二 维 码 并 实现 控制 台 输 出 


使 用 qrcode 包 实 现 将 二 维 码 转化 为 黑白 格 输出 在 控制 台 , 如 果 IDE 为 白色 背景 ， 需 要 


将 BLACK 和 WHITE 的 内 容 互 换 。 


def genqrcode (self): 


mm 


在 控制 台 输出 二 维 码 
:return: 
mm 
str2qr terminal (self.wx conf['API qrcode'] + self.uuid) 
def str2qr terminal (text): 
qr=qrcode .QRCode () 
qr.border=1 
qr.add data (text) 
mat=qr.get matrix() 
print qr (mat) 
def print qr(mat): 
kor 2 dn nats 
BLACK="'\033[47m \033[0m'" 
WHITE="\033[40m \033[0m'" 
print(''.join([BLACK if j else WHITE for j in i])) 
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Es 


注 : 因 微 信 网 页 版 的 运行 过 程 涉 及 的 流程 过 多 ， 代 码 过 长 ， 此 处 不 再 一 一 列 出 ， 读 者 
可 根据 下 面 调度 函数 的 执行 直接 查看 对 应 代码 。 
四 运行 流程 调度 函数 


def start (self): 
self.Log.info(Constant.LOG MSG START) # 记 录 机 器 人 运行 


dl=datetime .now() # 启 动 时间 
flag=True 
while True: 
d2=datetime .now() # 当 前 时 间 
d=d2 -= dl 
if d.seconds > 240: # 超 过 240 秒 未 扫 码 自动 结束 进程 
os .system(Constant .LOG MSG KILL PROCESS % os.getpid()) 
ELads 


run (Constant.LOG MSG GET _UUID，self.getuuid)# 获 取 二 维 码 
self.Log.info(Constant .LOG MSG GET QRCODE) 间 记 录 获 取 二 维 码 


self.genqrcode () # 打 印 二 维 码 
self.Log.info (Constant.LOG MSG SCAN QRCODE) “ 井 记 录 需 要 扫描 二 维 码 
flag=False 


dl=datetime .now() 

tm=int (time.time ()) 

if not self.waitforlogin (tm=tm) :# 等 待 确认 
self.Log.info(time .strftime ("%Y-%m-%d %H:%M:%S")) 
continue 


self.Log.info(Constant.LOG MSG CONFIRM LOGIN) 


break 
run (Constant .LOG MSG LOGIN，self.1ogin) # 登 录 
run (Constant .LOG MSG INIT, self.webwxinit) # 初 始 化 


run (Constant .LOG MSG STATUS NOTIFY， self.webwxstatusnotify)# 开 启 状态 通知 
run (Constant .LOG MSG GET CONTACT, self.get contact) # 获 取 联 系 人 
self.Log.info(Constant.LOG MSG CONTACT COUNT %$ ( 
self.MemberCount, len(self.MemberList) 
)) # 记 录 好 友信 息 
self.Log.info(Constant.LOG MSG OTHER CONTACT COUNT % ( 
len(self.GroupList), len(self.ContactList), 
len (self.SpecialUsersList), len(self.PublicUsersList) 
内 ## 记 录 群 聊 、 特 殊 账号 信息 
run (Constant .LOG MSG GET GROUP MEMBER, self. fetch group contacts)# 获 取 群 成 员 
ret=self.send text('filehelper'，" 我 上 线 了 . . .") # 发 送 上 线 消息 
self.Log.info (ret) 


gc.collect () # 回 收 垃圾 
self.Log.info("groups number: %d" % len(self.GroupList)) 
self.init thread () # 初 始 化 线程 
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while True: 
[retcode，selector]=self.synccheck() # 检 测 新 消息 
self.Log.debug ('tag:%®%s,; retcode: %s, selector: %35" % (self.tag, 
retcode, selector)) 
self.exit code=int (retcode) 
if retcode=—="'1100°": 
self.Log.info(Constant .LOG MSG LOGOUT) 
break 
if retcode=="'1101': 
self.Log.info(Constant.LOG MSG LOGIN OTHERWHERE) 
break 
if retcode=="'1102': 
self.Log.info(Constant.LOG MSG QUIT ON PHONE) 
break 
elif retcode=="'0°': 
if selector=="'0°': 
time.sleep (self.time out) 
Sises 
r=self .webwxsync () # 获 取消 息 
if r is not None: 
a 
self.handle mod(r) # 处 理 联系 人 变更 
self.handle msg(r) # 处 理 消息 
except Exception as ex: 
self.Log.info(r) 
self.Log.error (traceback.format exc()) 
else: # 未 知 状态 
r=self .webwxsync () 
self.Log.debug('sync check error webwxsync: %s\n' gs json.dumps(r)) 


8.4 扩展 功能 


8.4.1 自动 回复 


自动 回复 分 为 关键 词 回复 和 普通 话语 回复 ， 实 现 逻 辑 是 在 程序 启动 时 初始 化 关键 词 字 
典 ， 其 中 key 为 关键 词 内 容 进 行 md5 加 密 ，value 为 要 回复 的 内 容 。 当 收 到 好 友 消 息 后 ， 
在 关键 词 字典 中 检测 是 否 有 对 应 的 键 ， 若 存在 ， 则 自动 回复 该 内 容 ， 对 于 不 在 关键 词 中 的 
话语 ， 则 将 好 友 发 送 的 话语 作为 内 容 ， 调 用 第 三 方 机 器 人 获取 返回 值 进行 回复 。 


五 


El 
五 
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本 程序 使 用 图 灵机 器 人 的 API 实现 对 话 ， 对 于 图 灵机 器 人 的 相关 内 容 ， 请 读者 查看 其 
官方 文档 ， 网 址 为 “https://www.kancloud.cn/turing/web_api/522989”。 
@ 初始 化 关键 词 字典 
self.keyword reply={ # 初 始 化 关键 词 
get_md5_value ("你 好 ") : "我 很 好 ， 你 呢 ?"， 
get md5 value ("你 是 谁 ") : "我 是 可 爱 的 ceekBot!m， 


¥ 
注 ， 本 程序 直接 初始 化 了 字典 ， 在 实际 开发 中 为 了 方便 管理 可 使 用 数据 库 管 理 。 
四 封装 调用 图 灵机 器 人 API 函数 


def call tuling(self, text, user id=None) : 


调用 图 灵机 器 人 
:param text: 消息 内 容 
:param user _ id: 用 户 唯 一 标识 ， 用 于 上 下 文 
:return: 回复 的 内 容 
msg={ #API 所 需 参 数 
'key': Constant .TULING API KEY, #key 
bh # 内 容 
"userid': user id ， # 用 户 唯 一 标识 


} 
res=post (Constant .TULING API URL, msg) 
dE Ess 
if int(res['code'])==100000: 
return res['text'] 
elif int(res['code'])==200000: 
return res['text'] + '\r' + res['url'] 
SLSe: 
return res['text'] 
else: # 异 常 
Feturn Constant.TULING NOT_RES 间 " 我 不 知道 你 在 说 些 什么， 换个 话题 吧 . . ." 


全 自动 回复 实现 


if get md5 value (content) in self.wechat .keyword rep1Y:# 判 断 是 否 存在 该 关键 词 
text=self .wechat .keyword reply[get_md5 value (content)] 
elif content.startswith('msgs/'): 
tezxt=' 天 哪 ， 我 还 不 能 处 理 非 文 本 消息 ~' 
else: # 不 存在 调用 图 灵机 器 人 API 
text=self.call tuling(content, get md5 value (user['NickName'])) 
data={ 
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"msgType": 17 
"data”: text 


a 
t=random.uniform(1, 4) # 随 机 休眠 一 定 的 时 间 再 


四 
闻 


time.sleep (t) 
self.send msg(data，user['UserName']) # 发 送 消息 
self.Log.info('to:$%s, send:$s' $ (user['NickName'], text)) # 记 录 发 送信 息 


@ 发 送 文本 消息 函数 


def webwxsendmsg (self, word, to='filehelper'): 
mmm 
发 送 消息 
:param word: 消息 内 容 
:param to: 接收 人 ID 
:return: Dict or None 
mm 
dic=None 
flag=0 
while flag < 2: # 出 错 会 进行 一 次 重 发 
tr 
url=self.wx conf['API webwxsendmsg'] + \ 
"?pass ticket=%s' $% (self.pass ticket) 
clientMsgId=str (int (time.time() * 1000)) + \ 


str(random.random()) [:5] .replace('.', '') 
params={ 
'BaseRequest': self.get base request (), 
a 
ye 半 


"Content": word, 
"FromUserName": self.User['UserName']， 
"ToUserName": to, 
"LocalID": clientMsgId, 
"ClientMsgId": clientMsgId 
}, 
“SCepe 0 
} 
headers={'content-type': "application/json; charset=UTF-8'} 
return post (url, params, True, headers) 
except: 
LE dle 
self.Log.info(dic) 
flag=flag + 1 
self.Log.error (traceback.format exc()) 


return None 
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其 实现 效果 如 图 8-5 所 示 。 


GeekBot 


| 部 [jnmB oaoB ,zs 
晴 南 风 微风 ,最 低 气温 14 
度 ， 最 高 气温 30 度 


图 8-5 自动 回复 演示 


8.4.2 群发 消息 、 定 时 发 送 消息 、 好 友 状 态 检测 


对 于 个 人 微 信 用 户 而 言 ， 在 节日 时 经 常会 群发 消息 ， 可 是 千篇一律 的 祝福 不 仅 无 法 体 
现 出 心意 ， 反 而 会 让 接收 者 厌烦 ， 但 一 个 一 个 发 送 又 太 过 烦琐 ， 本 程序 实现 的 群发 消息 可 
根据 接收 者 昵称 或 备注 自动 填充 , 做 到 发 送 的 每 一 条 消息 都 不 一 样 , 接收 者 也 更 容易 接收 。 

定时 发 送 消息 的 需求 主要 为 自动 报时 ， 防 止 因 长 时 间 没 有 消息 被 微 信 认为 挂机 而 强制 
下 线 等 ， 一 般 可 通过 此 方法 延长 机 器 人 的 运行 时 长 。 

在 群发 消息 时 ， 若 遇 到 好 友 状 态 异常 ， 例 如 拉 黑 或 删除 等 ， 微 信 会 发 送 系统 消息 ， 提 
示 该 好 友 状 态 异 常 ， 此 时 可 通过 检测 微 信 返 回 消息 ， 并 给 异常 好 友 不 同 的 备注 来 实现 好 友 
状态 检测 功能 。 

注意 : 在 群发 消息 时 需要 注意 发 送 频率 , 编者 经 过 几 次 测试 ,发现 有 10 个 好 友 , 在 1 一 
4 秒 时 间 段 随机 取 一 个 时 间 进 行 休眠 , 连续 12 小 时 发 送 文本 消息 未 出 现 因 发 送 频繁 被 限制 
发 送 的 情况 ， 因 此 本 程序 限制 随机 时 间 为 1~4 秒 。 文件 消息 需 延 长 此 时 间 ， 可 以 通过 配置 
文件 修改 文 本 消息 休眠 时 长 。 

@ 发 送 消息 线程 


def process (self) : 


text="Never lie to someone who trust you. Never trust someone who lies 
志 OWYOU 二 Ols Wa 
for contact in self.wechat.ContactList: 

#self .wechat .send text (contact['UserName'], text % contact['NickName']) 
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self.wechat.Log.info("send msg to:%s, text:%s" % (contact['NickName'], 
text $$ contact['NickName'])) 
t=random.uniform(1, 4) 
time.sleep (t) ## 随 机 休眠 一 段 时 间 ， 避 免 微 信 认为 操作 违法 
# 每 小 时 向 文件 助手 发 送 一 个 消息 ， 避 免 长 时 间 无 操作 被 微 信 认 为 挂机 ， 从 而 强制 下 线 
current minutes=int (get now time('%M')) 
if current minutes==59: 
self.wechat .send text('filehelper',，' 主 人 主人 ,为 您 报时 , 当前 时 间 :%s' % 
get now time()) 
time.sleep (60) 


注意 : 在 好 友 多 的 情况 下 ， 群 发 消息 因为 需要 休眠 比较 耗 时 ， 一 般 采 用 多 线程 实现 群 
发 ,避免 影响 主线 程 同 步 消 息 断 开 。 在 实际 开发 中 ,发 送 消息 任务 一 般 通 过 Tedis 等 消息 队 
列 通 知 发 送 消 息 内 容 ， 机 器 人 获取 到 之 后 进行 发 送 。 

@ 发 送 结果 

群发 消息 演示 如 图 8-6 所 示 。 


图 8-6 群发 消息 演示 


注意 : 为 避免 给 好 友 带 来 骚扰 ， 上 述 代码 中 调用 发 送 函 数 的 语句 已 注释 ， 通 过 Log 打 
印 要 发 送 的 消息 展示 发 送 结果 。 
@ 好 友 状 态 检测 


SYS BLACK LIST CONTRACT= ' 消 息 已 发 出 ， 但 被 对 方 拒 收 了 。 
SYS_DELETE CONTRACT=' 开 启 了 朋友 验证 ， 你 还 不 是 他 《〈 她 ) 朋友 。 请 先 发 送 朋友 验证 请 求 ， 
对 方 验证 通过 后 才能 聊天 ' 
if msg['MsgType']==self.wechat.wx conf['MSGTYPE SYS']: 
if content==Constant.SYS BLACK LIST CONTACT: 并 黑 名 单 
res=self.wechat .webwxoplog (msg['FromUserName'], 


remark _name= 'A- 拉 黑 -%s' % user['NickName']) 

self.wechat .Log.info(' [ 黑 名 单 ] 给 %s 设置 备注 :$s'% (user['NickName']，res) ) 
elif Constant.SYS DELETE CONTACT in content: 间 被 删除 好 友 

res=self.wechat .webwxoplog (msg['FromUserName'], 

remark name= 'A- 删 除 -%s' s user['NickName']) 

self .Log.info(' [删除 好 友 ] 给 $s 设置 备注 :$s' % (user['NickName'],， res)) 
elif content.startswith (Constant.SYS ACCESS VERIFY INFO START): 


# 新 添加 好 友 
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data={ 
"msgType": 1, 
"data”s '%s 你 好 ， 终于 等 到 你 ~ "$$ user['NickName'] 
4 
self.send msg(data, user['UserName']) 
self .Log.info(' [新 增 好 友 ] 给 $s 发 送 欢 迎 语 ' % (user['NickName'])) 


8.4.3 ”自动 邀请 好 友 加 入 群 聊 


对 于 一 些 公司 或 个 人 的 特殊 需求 ， 需 要 根据 某 些 属性 自动 邀请 用 户 进入 不 同 的 群 聊 ， 
例如 华中 区 、 华 南 区 等 ， 此 时 需要 机 器 人 根据 用 户 发 送 的 特殊 指令 + 关键 词 〈 例 如 我 要 入 
群 + 华中 ) 自动 查询 所 属 的 群 获 ， 然 后 给 该 用 户 发 送 入 群 链接 ， 并 引导 用 户 单 击 加 入 。 

程序 设计 包括 好 友 消 息 分 析 、 关 键 词 和 群 聊 对 应 关系 、 自 动 发送 入 群 邀 请 、 自 动 发 送 
提示 语句 等 ， 具 体 如 下 : 

@ 初始 化 关键 词 和 群 获 对 应 关系 

self.enter group keyword={ 自动 入 群 关键 词 和 群 聊 对 应 字典 

呈 群 ':' 测 试 1 群 '， 
'2 群 ':' 测 试 2 群 '， 


} 
@ 根据 群 名 查找 群 姥 


def get group by name(self, name): 
for member in self.GroupList: 
if member['NickName']==name: 
return member 
return None 
} 


@ 更 新 群 购 API 函数 


def webwxupdatechatroom(self, room user name, add arr="", del arr="", 
invite arr="", topic=None): 


flag=0 
dic=None 
while flag < 2: 
ERY 
params={ 
'BaseRequest': self.get base request ()， 
'ChatRoomName': room user name 
3 


base url=self.wx conf['API webwxupdatechatroom'] + '?fun=%s' 
if invite arr: # 发 送 入 群 邀请 链接 
Url=base url % "invitemember" 


params['InviteMemberList']=invite arr 
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elif adq arr: 直接 添加 进 群 
url=base url 当 "addmember' 
params['AddMemberList']=add arr 
elif del arr: 删除 群 成 员 
url=base url $ 'delmember' 
params['DelMemberList']=add arr 
elif topic: 音 修 改 群 名 
url=base url $% "modtopic'" 
params['NewTopic']=topic 
headers={'content-type': 'application/json; charset=UTF-8'} 
url += '&lang=zh CN&pass ticket=' + self.pass ticket 
dic=post (url, params, True, headers) 
#Ret 0 成 功 
# ”-1|-2 ”失败 和 群 开启 群 主 验证 
# ”1205 ”失败 操作 频繁 
if dic['BaseResponse']['Ret']!= 0: 
group=self.get group by id(room user name) 
self .Log.error(' [ss] 更 新 群 聊 失败 , 错误 代码 :$s, 错误 原因 :%s' % 
(group ['NickName']，dic['BaseResponse']['Ret']， 
dic['BaseResponse']['ErrMsg'])) 
self.Log.infol(str (dic)) 
return dic['BaseResponse'] ['Ret']==0 
except: 
flag=flag+1 
Les 
self.Log.info(dic) 
self.Log.error (traceback.format exc()) 
return False 


} 


@ 好 友 消息 分 析 

#Constant .STRING_ENTER_ GROUP _ KEYWORD=' 我 要 入 群 +' 

if Constant.STRING ENTER GROUP KEYWORD in content: 井 关 键 词 入 群 
keyword=content .split (Constant .STRING ENTER GROUP KEYWORD) [1] 
# 在 关键 词 列表 中 查找 所 属 群 


room name=self.wechat.enter group keyword[keyword] if keyword in self 
.wechat .enter group keyword else None 


remind msg=Constant.STRING ENTER GROUP NOT FOUND  ”# 换 个 关键 词 试 试 
if room name: 


group=self.wechat .get group by name (room name) 
if group: 


res=self .wechat .webwxupdatechatroom(group['UserName'], invite arr 
=user['UserName']) 
1£. Tos: 


remind msg=Constant .STRING ENTER GROUP _ SUCCESS# 邀 请 链接 进 群 
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else: 
remind msg=Constant .STRING ENTER GROUP _ UNKNOWN ERROR# 出 错 

data={ 

"mgrypem lr 

"data": remind msg 
} 
t=random.uniform(1, 4) 
time .sleep (t) 
self.send msg(data, user['UserName']) 
self.Log.info('to:%s,send:%s' $ (user['NickName'], remind msg))} 


实现 效果 如 图 8-7 所 示 。 


中 
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图 8-7 自动 发 送 入 群 邀 请 
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9.1 二 维 码 介绍 


二 维 码 〈 二 维 条 码 ) 是 指 在 一 维 条 码 的 基础 上 扩展 出 的 另 一 维 具有 可 读 性 的 条 码 ， 使 
用 黑白 矩形 图 案 表 示 二 进 制 数据 ， 被 设备 扫描 后 可 获取 其 中 所 包含 的 信息 。 一 维 条 码 的 宽 
度 记载 着 数据 ， 而 其 长 度 没 有 记载 数据 。 二 维 条 码 的 长 度 、 宽 度 均 记载 着 数据 。 二 维 条 码 
有 一 维 条 码 没 有 的 “定位 点 ”和 “容错 机 制 ”。 容 错 机 制 使 得 在 即使 没有 辨识 到 全 部 的 条 码 
或 者 条 码 有 污 损 时 也 可 以 正确 地 还 原 条 码 上 的 信息 。 二 维 码 的 种 类 很 多 ， 不 同 的 机 构 开 发 
出 的 二 维 码 具 有 不 同 的 结构 以 及 编写 、 读 取 方 法 。 

@ 堆 乔 式 一 维 码 

堆叠 式 二 维 码 例如 PDF417〔 证 件 及 卡片 等 大 容量 、 高 可 靠 性 信息 自动 存储 、 携 带 并 
可 用 机 器 自动 识别 )、Code49、Codel6K、Ultracode 等 。 

@ 咎 阵 式 一 维 码 

矩阵 式 二 维 码 例如 QR 码 、Code One、Aztec、Data Matrix 等 。 

本 章 使 用 的 二 维 码 是 QR Code (Quick Response Code)， 学 名 为 快速 响应 矩阵 码 ， 它 是 
二 维 条 码 的 一 种 。QR 二 维 码 目 前 在 很 多 地 方 有 着 广泛 的 应 用 ， 例 如 通过 微 信 二 维 码 加 好 
友 、 将 应 用 软件 的 下 载 地 址 做 成 二 维 码 ,等 等 -QR 二 维 码 是 于 1994 年 由 日 本 的 Denso-Wave 
公司 发 明 的 。QR 是 英文 Quick Response 的 缩写 ， 即 快速 响应 的 意思 ， 源 自发 明 者 希望 QR 
码 可 让 其 内 容 快速 被 解码 。QR 二 维 码 比 普通 条 码 可 储存 更 多 资料 ， 也 无 须 像 普通 条 码 那 
样 在 扫描 时 需要 直线 对 准 扫描 器 。 
QR 码 呈 正方 形 ， 只 有 黑 、 白 两 色 ， 在 3 个 角落 印 有 较 小 、 像 “ 回 ” 字 的 正方 形 图 案 。 
这 3 个 图 案 是 帮助 解码 软件 定位 的 图 案 ， 用 户 不 需要 对 准 ， 无 论 以 何 角度 扫描 ， 数 据 仍 可 
被 正确 读 取 。 

QR 二 维 码 的 结构 如 下 。 
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生成 二 维 码 和 验证 码 


(1) 版 本 信息 : version1l (21x21)，version2，…，version40， 一 共 40 个 版 本 。 版 本 代 
表 每 行 有 多 少 码 元 模块 ， 每 一 个 版 本 比 前 一 个 版 本 增加 4 个 码 元 模块 ， 计 算 公 式 为 (n-1)x 
4+21， 每 个 码 元 模块 存储 一 个 二 进 制 0 或 者 1， 黑 色 模 块 表 示 二 进 制 “1”， 白 色 模 块 表示 
二 进 制 “0” 例如 versionl 表示 每 一 行 有 21 个 码 元 模块 。 
(2) 格式 信息 : 存储 容错 级 别 有 工 (7%)、M (15%)、Q (25%)、R (35%)。 容 错 指 
允许 存储 的 二 维 码 信 息 出 现 重 复 部 分 ， 级 别 越 高 ， 重 复 信 息 所 占 的 比例 越 高 。 其 目的 是 即 
使 二 维 码 被 图 标 遮 住 一 部 分 ， 一 样 可 以 获取 全 部 二 维 码 内 容 。 有 图 片 的 二 维 码 ， 图 片 不 算 
二 维 码 的 一 部 分 ， 它 部 分 码 元 ， 但 还 是 可 以 扫描 到 所 有 内 容 。 

(3) 数据 和 纠 错 码 字 : 实际 保存 的 二 维 码 信息 和 纠 错 码 字 ( 用 于 修正 二 维 码 损坏 带 来 
的 错误 ， 也 就 是 说 当 码 元 被 图 片 遮 可 以 通过 纠 错 码 字 来 找 回 )。 

(4) 位 置 探测 图 形 : 用 于 对 二 维 码 的 定位 。 位 置 探测 图 形 用 于 标记 抑 形 大 小 ，3 个 图 
形 确 定 一 个 矩形 。 

上 述 二 维 码 结构 信息 按照 一 定 的 编码 规则 变 成 二 进 制 ， 通 过 黑 、 白 色 形成 矩形 。 

除了 标准 的 QR 码 之 外 ， 还 存在 一 种 称 为 “微型 QR 码 ” 的 格式 ， 它 是 QR 码 标准 的 
缩小 版 本 ， 主 要 是 为 了 无 法 处 理 较 大 型 扫描 的 应 用 而 设计 。 微 型 QR 码 同样 有 多 种 标准 ， 
最 多 可 存储 35 个 字符 。 


9.2 ”二 维 码 生成 和 解析 关键 技术 
9.2.1 qrcode 库 的 使 用 


@ 安装 qrcode 库 

如 果 要 用 Python 生成 二 维 码 ， 首 先 需要 下 载 Python 的 二 维 码 库 qrcode。qrcode 库 是 
用 于 生成 二 维 码 图 像 的 Python 第 三 方 库 。 

qrcode 二 维 码 生 成 包 的 安装 如 下 《〈 在 命令 行 cmd 中 ): 


be 


C:\> pip install qrcode 
查看 qrcode 库 的 安装 信息 ， 如 图 9-1 所 示 。 


C:\> pip show qrcode 


国 管理 员 : C\Windows\system32\cmd.exe 


图 9-1 查看 qrcode 库 的 安装 信息 
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@ 生成 一 维 码 

导入 qrcode 模块 后 ，make0 函 数 返 回 一 个 qrcode.image.pil.PilImage 对 象 ， 调 用 make() 
函数 生成 一 个 二 维 码 图 片 对 象 ， 如 图 9-2 所 示 ， 最 后 调用 图 片 对 象 的 saveO 函 数 就 可 以 将 
生成 的 二 维 码 保存 下 来 。 代 码 如 下 : 


import qrcode 


img=qrcode .make ("http://www.zut.edu.cn") 
img.save ("xinxing.png") 


图 9-2 生成 的 二 维 码 图 片 xinxing.png 


上 面 是 按照 qrcode 默认 的 方式 生成 二 维 码 ， 如 果 希 望 生成 不 同 尺寸 的 二 维 码 ， 则 需要 
使 用 QRCode 类 ， 如 下 : 

QRCode (version=None, error correction=constants.ERROR CORRECT M, box size=10, 

border=4, image factory=None) 

version 表示 二 维 码 的 版 本 号 ， 二 维 码 总 共有 1 一 40 个 版 本 ， 最 小 的 版 本 号 是 1， 对 应 
的 尺寸 是 21X21, 每 增加 一 个 版 本 会 增加 4 个 尺寸 这 里 所 说 的 尺寸 不 是 生成 图 片 的 大 小 ， 
而 是 指 二 维 码 的 长 宽 被 平均 分 为 多 少 份 。 

error_correction 指 的 是 纠 错 容量 ， 这 就 是 为 什么 二 维 码 上 面 放 一 个 小 图 标 也 能 扫 出 来 
的 原因 ， 纠 错 容 量 有 4 个 级 别 ， 分 别 如 下 。 

。 ERROR CORRECT LL 级 别 : 7% 或 更 少 的 错误 能 修正 。 

。 ERROR_ CORRECT M M 级 别 : 15% 或 更 少 的 错误 能 修正 , 也 是 qrcode 的 默认 级 别 。 

。 ERROR CORRECT QQ 级 别 : 25% 或 更 少 的 错误 能 修正 。 

。 ERROR CORRECT_H H 级 别 : 30% 或 更 少 的 错误 能 修正 。 

box_size 指 的 是 生成 图 片 的 像素 。 

border 表示 二 维 码 的 边框 宽度 ，4 是 最 小 值 。 

image_factory 参数 是 一 个 继承 于 qrcode.image.base.BaseImage 的 类 ， 用 于 控制 make_ 
image() 函 数 返 回 的 图 像 实例 。image_factory 参数 可 以 选择 的 类 保存 在 模块 根 目录 的 image 
文件 夹 下 。image 文件 夹 里 面 有 5 个 .py 文件 ， 其 中 一 个 为 ”init _.py, 一 个 为 base.py， 还 
有 pilpy (提供 了 默认 的 qrcode.image.pil.PilImage 类 )、pure.py (提供 了 grcode.image 
.pure.PymagingImage 类 )、svg.py (提供 了 SvgFragmentImage、SvgImage 和 SvegPathImage 
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几 个 类 )。 


注 : 实际 上 ，make0 函 数 也 是 通过 实例 化 一 个 QRCode 对 象 来 生成 二 维 码 的 。 在 调 


make() 的 时 候 也 可 以 传 入 初始 化 参数 。 


例子 如 下 : 


import qrcode 
qr=qrcode .QRCode( 
version=1, 
error correction=qrcode.constants.ERROR CORRECT L, 
box size=10, 
border=4, 
) 
qr.add datal('http://www.zut.edu.cn') 
qr.make (fit=True) 
img=qr .make image () 


img.save('xinxingzhao.png') 


说 明 :; QRCode 对 象 的 make_image() 函 数 可 以 通过 改变 多 1 color 和 back_color 参数 来 


改变 所 生成 图 片 的 背景 颜色 和 格子 颜色 。 


下 


@ 生成 其 他 类 型 的 二 维 码 
户 可 以 将 二 维 码 图 片 转化 为 SVG (矢量 图 )。 qrecode 可 以 生成 3 种 不 同 的 SVG 图像， 


h 是 用 路 径 表 示 的 SVG， 一 种 是 用 和 矩形 集合 表示 的 完整 SVG 文件 ， 还 有 一 种 是 用 矩形 


集合 表示 的 SVG 片段 。 第 1 种 用 路 径 表示 的 SVG 其 实 就 是 矢量 图 ， 可 以 在 图 像 放 大 的 时 
候 保 持 图 片 质量 ， 而 另外 两 种 可 能 会 在 格子 之 间 出 现 空隙 。 


调 


这 3 种 分 别 对 应 了 svg.py 中 的 SvgPathImage、SvgImage 和 SvgFragmentImage 类 。 在 
qrcode.make() 函 数 或 者 实例 化 QRCode 时 当 作 参数 传 入 就 可 以 了 。 
另外 还 有 qrcode.image.svg.SvgFillImage 和 qrcode.img.svg.SvgPathFillImage， 分 别 继承 


自 SvgImage 和 SvgPathImage。 这 两 个 并 没有 其 他 改变 ， 只 不 过 是 默认 把 背景 颜色 设置 为 
色 而 已 。 


import qrcode 
import qrcode.image.svg 
if method=='basic' : 
# 简 单 的 工厂 ， 只 有 一 套 
factory=qrcode.image.svg.SvgImage 
elif method=='fragment' : 
# 碎 片 工 厂 ( 也 只 是 一 组 矩形 ) 
factory=qrcode.image.svg.SvgFragmentImage 
else: 
# 组 合 路 径 工 厂 ， 修 复 缩放 时 可 能 出 现 的 空白 
factory=qrcode .image.svg-SvgPathImage 


img=qrcode .make ('xinxingzhao', image factory=factory) 
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9.2.2 ”PIL 库 的 使 用 


生成 二 维 码 图 像 同时 依赖 于 PIL 库 ，PIL (Python Imaging Library， 图 像 处 理 类 库 ) 提 
供 了 通用 的 图 像 处 理 功 能 ， 以 及 大 量 有 用 的 基本 图 像 操作 ， 例 如 图 像 的 缩放 、 裁 前 、 旋 转 
和 颜色 转换 等 。PIL 是 Python 语言 的 第 三 方 库 ， 安 装 PIL 库 的 方法 如 下 ， 需 要 安装 的 库 的 
名 字 是 pillow。 


C:\> pip install pillow 或 者 pip3 install pillow 


PIL 库 支 持 图 像 的 存储 、 显 示 和 处 理 ， 能 够 处 理 几乎 所 有 图 片 格式 ， 可 以 完成 对 图 像 
的 缩放 、 剪 裁 、 释 加 以 及 向 图 像 添加 线条 和 文字 等 操作 。 

PIL 库 主 要 实现 图 像 归档 和 图 像 处 理 两 方面 的 功能 需求 。 

。 图 像 归档 : 对 图 像 进行 批 处 理 、 生 成 图 像 预览 、 转 换 图 像 格式 等 。 

。 图 像 处 理 : 图 像 的 基本 处 理 、 像 素 处 理 、 颜 色 处 理 等 。 

根据 不 同 功能 ，PIL 库 共 包括 21 个 与 图 像 相 关 的 类 ， 这 些 类 可 以 被 看 作 是 子 库 或 PIL 
库 中 的 模块 ， 各 模块 如 下 : 

Image 、ImageChops、ImageCrackCode 、ImageDraw、ImageEnhance 、 ImageFile 、 


ImageFileIO、 ImageFilter、 ImageFont、 ImageGrab、 ImageOps、 ImagePath、 ImageSequence、 
ImageStat、ImageTk、ImageWin、PSDraw 

下 面 介绍 几 种 最 常用 的 模块 。 

@ Image 模块 

Image 模块 是 PIL 中 最 重要 的 模块 ， 它 提供 了 诸多 图 像 操作 功能 ， 例 如 创建 、 打 开 、 
显示 、 保 存 图 像 竺 功能， 合成、 裁剪 、 滤 波 等 功能 ， 获 取 图 像 属性 等 功能 。 

PIL 中 的 Image 模块 提供 了 Image 类 ， 用 户 可 以 使 用 Image 类 从 大 多 数 图 像 格式 的 文件 中 
读 取 数据 ， 然 后 写 到 最 常见 的 图 像 格式 文件 中 。 如 果 要 读 取 一 幅 图 像 ， 可 以 使 用 以 下 代码 : 


from PIL import Image 


pil im=Image.open('empire.jpg') 
上 述 代码 的 返回 值 pil_im 是 一 个 PIL 图 像 对 象 。 
用 户 也 可 以 直接 使 用 Image.new(mode,size,color=None) 创 建 图像 对 象 ，color 的 默认 值 
是 黑色 。 

newIm=Image.new('RGB', (640, 480), (255, 0, 0)) # 新 建 一 个 Image 对 象 

这 里 新 建 了 一 个 红色 背景 、 大 小 为 〈640, 480) 的 RGB 空白 图 像 。 

图 像 的 颜色 转换 可 以 使 用 Image 类 的 convert() 方 法 来 实现 。 如 果 要 读 取 一 幅 图 像 ， 并 
将 其 转换 成 灰 度 图 像 ， 只 需要 加 上 convert(L) 即 可 ， 例 如 : 

pil im=Image.open('empire.jpg') .convert ('L') # 转 换 成 灰 度 图 像 

四 ImageChops 模块 

ImageChops 模块 包含 一 些 算术 图 形 操作 ， 即 channel operations("chops")。 这 些 操作 可 
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用 于 诸多 目的 ， 例 如 图 像 特效 、 图 像 组 合 、 算 法 绘图 等 。 通 道 操作 只 用 于 位 图 (比如 工 模 
式 和 RGB 模式 )。 大 多 数 通 道 操作 有 一 个 或 者 两 个 图 像 参 数 ， 返 回 一 个 新 的 图 像 。 
每 张 图 片 都 是 由 一 个 或 者 多 个 数据 通道 构成 的 。 以 RGB 图 像 为 例 , 每 张 图 片 都 是 由 3 
个 数据 通道 构成 的 ， 分 别 为 R、G 和 B 通道 。 对 于 灰 度 图 像 ， 只 有 一 个 通道 。 
ImageChops 模块 的 使 用 如 下 : 


from PIL import Image 


im=Image.open('D:\\1.jpg') 
from PIL import ImageChops 


im dup=ImageChops.duplicate (im) # 复 制图 像 ， 返 回 给 定 图 像 的 副本 
print (im dup.mode) # 输 出 模式 : 'RGB' 


im diff=ImageChops.difference (im, im dup) # 返 回 两 幅 图 像 之 间 像素 差 的 绝对 值 形成 的 图 像 
im diff.show() 


1 于 图 像 im_ dup 是 由 im 复制 过 来 的 ， 所 以 它们 的 差 为 0， 图像 im_diff 在 显示 时 为 
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ImageDraw 模块 

ImageDraw 模块 为 Image 对 象 提供 了 基本 的 图 形 处 理 功能 ， 例 如 它 可 以 为 图 像 添加 几 
何 图 形 。 

ImageDraw 模块 的 使 用 如 下 : 


from PIL import Image, ImageDraw 
im=Image.open('D:\\1.jpg') 

draw=ImageDraw.Draw (im) 

draw.line((0,0)+im.size, fill=128) 

draw.line((0, im.size[1], im.size[0], 0), fill=128) 
im.show() 


其 结果 是 在 原 有 图 像 上 画 了 两 条 对 角 线 。 

@ ImageEnhance 模块 

ImageEnhance 模块 包括 了 一 些 用 于 图 像 增强 的 类 ， 它 们 分 别 为 Color 类 、Brightness 
类 、Contrast 类 和 Sharpness 类 。 

ImageEnhance 模块 的 使 用 如 下 : 

from PIL import Image, ImageEnhance 

im=Image.open('D:\\1.jpg') 

enhancer=ImageEnhance.Brightness (im) 


im0=enhancer -enhance (0.5) 
im0.show() 


其 结果 是 图 像 im0 的 亮度 为 图 像 im 的 一 半 。 

全 ImageFile 模块 

ImageFile 模块 为 图 像 的 打开 和 保存 提供 了 相关 支持 功能 。 

@ ImageFilter 模块 

JImageFilter 模块 包括 各 种 滤波 器 的 预定 义 集合 ， 与 Image 类 的 filter0 方 法 一 起 使 
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该 模块 包含 一 些 图 像 增强 的 滤波 器 , 例如 BLUR、CONTOUR、DETAIL、 


EDGE ENHANCE、 


EDGE ENHANCE MORE、 EMBOSS、 FIND EDGES、SMOOTH、SMOOTH MORE 和 


SHARPEN。 
ImageFilter 模块 的 使 用 如 下 : 


from PIL import Image 


im=Image.open('D:\\1.jpg') 

from PIL import ImageFilter 

imout=im.filter (ImageFilter .BLUR) 

print (imout .size)# 图 像 的 尺寸 大 小 为 (300，450) ， 它 是 一 个 二 元 组 ， 即 水 了 
imout .show() 


@@ ImageFont 模块 


和 简直 方向 上 的 像素 数 


ImageFont 模 块 定义 了 一 个 同名 的 类 , 即 ImageFont 类 ,在 这 个 类 的 实例 中 存储 着 bitmap 


字体 ， 需 要 和 ImageDraw 类 的 text(0 方 法 一 起 使 用 。 


在 Python 中 通过 使 用 PIL 库 中 的 这 些 模块 和 类 来 处 理 和 使 用 图 像 。 


9.3.1 生成 带 有 图 标的 二 维 码 


事先 准备 一 个 logo 图 标 吴 得， 使 用 下 面 的 程序 生成 带 有 logo 图 标 


import qrcode 
from PIL import Image 
import os, sys 
def gen qrcode(string, path, lo0go=""): 
mm 
生成 中 间 带 1ogo 的 二 维 码 
需要 安装 qrcode、PIL 库 
8 参数 string: 二 维 码 字符 串 
@ 参 数 path: 生成 的 二 维 码 保存 路 径 
8 参数 1ogo: logo 文件 路 径 
@return: None 
mm 
# 初 步 生 成 二 维 码 图 像 
qr=qrcode .QRCode ( 
Version=2， 
error Correction=qrcode .constants .ERROR CORRECT 
box size=8, 
border=1 
) 
qr.add data (string) 
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H, 
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qr.make (fit=True) 
# 获 得 Image 实例 并 把 颜色 模式 转换 为 RGBR 
img=qr.make image() 
img=img .convert ("RGBA") 
if logo and os.path.exists (10go): 
try: 
icon=Image .open (1ogo) # 打 开 填 充 的 1ogo 文件 
img w, img h=img.size 
except Exception as e: 
print (e) 
sys.exit (1) 
factor=4 
# 计 算 1ogo 的 尺寸 
size w=int (img w/factor) 
size h=int (img h/factor) 
# 比 较 并 重新 设置 1ogo 文件 的 尺寸 
icon w,icon h=icon.size 
if icon WwW>size w: 
icon w=size W 
if icon h>size h: 
icon h=size h 
icon=icon.resize((icon w,icon h), Image.ANTIALIAS) 
# 计 算 logo 的 位 置 ， 并 复制 到 二 维 码 图 像 中 
w=int((img w-icon w)/2) 
h=int ((img h-icon h)/2) 
icon=icon.convert ("RGBA") 
img.paste(icon, (w, h),icon) 


# 保 存 二 维 码 
img.save (path) # 例 如 qrcode .png 
if _ name ==" main _": 
info=" http://www.zut.edu.cn " 
pic path="qrcode.png" # 生 成 的 带 有 图 标的 二 维 码 图 片 ， 如 图 9-3 所 示 
1ogo_path="logo.pngn" # 用 于 填充 的 图 标 


gen_qrcode (info, pic path,1ogo path) 


图 9-3 ”生成 的 带 有 图 标的 二 维 码 图 片 qrcode.png 
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9.3.2 Python 解析 二 维 码 图 片 


解析 二 维 码 图 片 的 信息 需要 使 


pip install zbarlight 


| zbarlight (二 维 码 解析 包 )，zbarlight 的 安装 如 下 : 


注意 ，zbarlight 二 维 码 解析 包 仅 仅 支持 Python2.7 以 下 的 版 本 。 


import zbar 
def decode qrcode (Path) : 
mmm 
解析 二 维 码 信息 
8 参数 path: 二 维 码 图 片 路 径 
ereturn: 二 维 码 信息 
mmm 
Scanner=zbar.ImageScanner () 
scanner.parse config('enable') 
img=Image.open (path) .convert ('L') 
width, height=img.size 
# 建 立 zbar 图 片 对 象 并 扫描 转换 为 字 节 信息 
qrCode=zbar.Image (width, height, 
scanner.scan (qrCode) 
# 组 装 解码 信息 
data="" 
for s in qrCode: 
data += s.data 
del img 
return data 
if _ name =="_ main _": 
info=" http://www.zut.edu.cn " 
pic path="qrcode.png" 
logo path="logo.png" 


# 创 建 图 片 扫描 对 象 

# 设 置 对 象 属性 

# 打 开 含有 二 维 码 的 图 片 
# 获 取 图 片 的 尺寸 


'Y800', img.tobytes()) 


# 删 除 图 片 对 象 
# 输 出 解码 结果 


# 生 成 的 带 有 图 标的 二 维 码 图 片 
# 用 于 填充 的 图 标 


gen qrcode (info, pic path,1ogo path) 


print (decode qrcode (pic path)) 


# 得 到 二 维 码 内 的 文本 信息 ， 即 网 址 “http://www.zut.edu.cn” 


9.4 用 Python 生成 验证 码 图 片 


基本 上 ， 大 家 使 用 每 
防止 恶意 注册 、 发 帖 而 设置 的 验证 手段 。 其 生成 原理 是 将 一 串 随 机 产生 的 
数字 或 符号 生成 一 幅 图 片 ， 图 片 里 加 上 一 些 干扰 像素 (防止 OCR)。 下 面 


详细 讲解 如 何 生 成 验证 码 。 


通常 ， 除 了 配置 好 的 Python 环境 以 外 ， 还 需要 配 有 Python 中 的 PIL 


库 ， 这 是 Python 中 专门 用 来 处 理 图 片 的 库 。 
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种 网 络 服务 都 会 遇 到 验证 码 ， 一 般 是 网 站 为 了 辐 


视频 讲解 
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如 果 要 生成 验证 码 图 片 ， 首 先 要 生成 一 个 随机 字符 串 ， 包 含 26 个 字母 和 10 个 数字 。 
# 用 来 随机 生成 一 个 字符 串 


def gene text(): 


#source=list (string.letters) 
RD cd Fe Ee 
se hr A | 
source=list (string.ascii letters) 
for index in range(0,10): 

source.append (str (index)) 
return ''.join(random.sample (source,number)) #number 是 生成 验证 码 的 位 数 


然后 要 创建 一 个 图 片 ， 写 入 字符 串 ， 需 要 注意 这 里 面 的 字体 是 不 同系 统 而 定 的 ， 如 果 
没有 找到 系统 字体 路 径 ， 也 可 以 不 设置 。 接 下 来 要 在 图 片上 画 几 条 干扰 线 。 
最 后 创建 扭曲 ， 加 上 滤 镜 ， 用 来 增强 验证 码 的 效果 。 下 面 是 用 程序 生成 的 一 个 验证 码 。 


Be 


完整 的 代码 如 下 : 


#coding=utf-8 

import random, string, sys, math 

from PIL import Image,ImageDraw,ImageFont, ImageFilter 
font path=' C:\Windows\Fonts\simfang.ttf " # 字 体 的 位 置 


number=4 # 生 成 几 位 数 的 验证 码 
size=(80, 30) # 生 成 验证 码 图 片 的 高 度 和 宽度 
bgcolor=(255, 255, 255) # 背 景 颜色 ， 默 认为 白色 
fontcolor=(0,0,255) # 字 体 颜 色 ， 默 认为 蓝 色 
linecolor=(255, 0, 0) # 干 扰 线 颜 色 ， 默 认为 红色 
draw line=True # 是 否 要 加 入 干扰 线 

line number=(1,5) # 加 入 干扰 线条 数 的 上 /下 限 


# 用 来 随机 生成 一 个 字符 串 
def gene text() : 
#source=list (string.letters) 
竹下 Sar SDD Or vO Mo nt MO hr i 全 
Ey me a se ,Or Vy eR 
source=list (string.ascii letters) 
for index in range(0,10): 
source.append (str (index)) 
return ''.join(random.sample (source,number) )#number 是 生成 验证 码 的 位 数 
# 用 来 绘制 干扰 线 
def gene line (draw,width,height) : 


begin= (random.randint (0, width), random.randint (0, height)) 
end= (random.randint (0, width), random.randint (0, height)) 
draw.line([begin, end], fill=]linecolor) 


# 生 成 验证 码 


def gene code(): 


187 | 


3 


on 项 目 案例 开发 
从 入 门 到 实战 一 一 爬虫 、 游 戏 和 机 器 学 习 


width,height=size # 宽 和 高 
image=Image.new ('RGBA', (width,height),bgcolor) # 创 建 图 片 
font=ImageFont .truetype (font path, 5 # 验 证 码 的 字体 
draw=ImageDraw.Draw (image) # 创 建 画笔 
text=gene text () # 生 成 字符 串 


font width, font height=font.getsize (text) 
draw.text (( (width - font width) /number, (height - font height) / number) ,text， 
font=font, fil1=fontcolor) # 填 充 字符 串 
if draw line: 
gene line (draw,width,height) 
image=image transform( (width+20,height+10), Image.AFFINE, 


(1,-0.3,0,-0.1,1,0),Image.BILINEAR) 着 创建 扭曲 
image=image.filter (ImageFilter.EDGE ENHANCE MORE) 间 滤 镜 ， 边 界 加 强 
image.save('idencode.png') 井 保存 验证 码 图 片 
__name ==" main _": 
gene code() 


通过 上 面 的 两 个 例子 可 见 Python 的 图 像 处 理 功能 十 分 完善 。 
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10.1 连连 看 游戏 介绍 


“连连 看 ”是 源 自 中 国 台 湾 的 桌面 小 游戏 ， 自 从 流入 中 国 大 陆 以 来 风靡 。 视频 讲解 
一 时 ， 也 吸引 了 众多 程序 员 开发 出 多 种 版 本 的 “连连 看 "“ 连 连 看 ”考验 的 是 玩家 的 眼力 ， 
在 有 限 的 时 间 内 只 要 把 所 有 能 连接 的 相同 图 案 两 个 一 对 地 找 出 来 ， 每 找 出 一 对 ， 它 们 就 会 
自动 消失 ， 把 所 有 的 图 案 全 部 消 完 即 可 获得 胜利 。 所 谓 能 够 连接 ， 指 的 是 无 论 横向 或 者 纵 
向 ， 从 一 个 图 案 到 另 一 个 图 案 之 间 的 连 线 不 能 超过 两 个 弯 ， 其 中 ， 连 线 不 能 从 尚未 消去 的 
图 案 上 经 过 。 

连连 看 游戏 的 规则 如 下 : 

。 两 个 选中 的 方块 是 相同 的 。 

。 两 个 选中 的 方块 之 间 连 接线 的 折 点 不 超过 两 个 (连接 线 由 X 轴 和 Y 轴 的 平行 线 组 

成 )。 
本 章 开发 连连 看 游戏 ， 游 戏 效果 如 图 10-1 所 示 。 


10-1 连连 看 游戏 的 运行 界面 


| 疙 沁 项 目 案例 开发 
从 入 门 到 实战 一 一 仆 虫 、 游 戏 和 机 器 学 习 

本 游戏 增加 了 智能 查找 功能 ， 当 玩家 自己 无 法 找到 可 以 消去 的 两 个 方块 时 右 击 画面 ， 
系统 则 会 提示 可 以 消去 的 两 个 方块 〈 被 加 上 红色 的 边框 线 )。 


10.2 程序 设计 的 思路 


@ 图 标 方块 的 布局 

游戏 中 有 10 种 方块 ， 如 图 10-2 所 示 ， 而 且 每 种 方块 有 10 个 ， 可 以 先 按 顺序 把 每 种 图 
标 方块 (数字 编号 ) 排 好 放 入 列表 tmpMap (临时 的 地 图 ) 中 ， 然 后 用 random.shuffle() 打 
乱 列表 元 素 的 顺序 ， 依 次 从 tmpMap〔 临 时 的 地 图 ) 中 取 一 个 图 标 方块 放 入 地 图 map 中 。 
实际 上 ， 在 程序 内 部 是 不 需要 认识 图 标 方块 的 图 像 的 ， 只 需要 用 一 个 ID 来 表示 ， 在 运行 
界面 上 的 图 标 图 形 是 根据 地 图 中 的 ID 取 资 源 里 的 图 片 画 的 。 如 果 ID 的 值 为 空 (" ")， 则 
说 明 此 处 已 经 被 消除 掉 了 。 
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图 10-2 图 标 方块 


imgs=[PhotoImage (file='H:\\ 连 连 看 \\gif\\bar 0'+str(i)+'.gif') for i in 
range (0,10)] # 所 有 图 标 图 案 
所 有 图 标 图 案 存 储 在 列表 imgs 中 ,地 图 map 中 是 图 标 图 案 存 储 在 列表 imgs 中 的 索引 
号 。 如 果 是 bar_02.gif 图 标 ， 在 地 图 map 中 实际 存储 的 是 2， 如 果 是 bar_08.gif 图 标 ， 在 地 
map 中 实际 存储 的 是 8。 
# 初 始 化 地 图 ， 将 地 图 中 的 所 有 方块 区 域 位 置 置 为 空 方块 状态 
map=[[" " for y in range (Height)]for x in range (Width)] 


# 存 储 图 像 对 象 


image map=[[" " for y in range (Height)]for x in range (Width)] 


| 


cv=Canvas (root, bg='green', width=610, height=610) 
def create map() :# 产 生 map 地 图 


global map 

# 生 成 随机 地 图 

# 将 所 有 匹配 成 对 的 图 标 索引 号 放 进 一 个 临时 的 地 图 中 
tmpMap=[] 


m= (Width)*(Height)//10 
Print ('m="',m) 


for x in range(0,m) : 
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for i in range(0,10): # 每 种 方块 有 10 个 
tmpMap .append (x) 
random. shuffle (tmpMap) # 生 成 随机 地 图 


for x in range (0,Width) : 
for y in range (0,Height) : 
map [x] [Y]=tmpMap [x*Height+y] 井 从 上 面 的 临时 地 图 中 获取 
四 连通 算法 
那么 分 析 一 下 ， 可 以 看 到 连接 一 般 有 3 种 情况 ， 如 图 10-3 所 示 。 


Ed 国 国 

2 © 
加 醒 
直 连 一 个 折 点 两 个 折 点 


图 10-3 ”两 个 选中 方块 之 间 连 接线 的 示意 图 

1) 直 连 方式 

在 直 连 方式 中 ， 要 求 两 个 选中 的 方块 x* 和 y 相同 ， 即 在 一 条 直线 上 ， 并 且 之 间 没 有 
他 任何 图 案 的 方块 。 直 连 方式 在 3 种 连接 方式 中 最 简单 。 

2) 一 个 折 点 
其 实 ， 该 情况 相当 于 两 个 方块 画 出 一 个 矩形 ， 这 两 个 方块 是 一 对 对 角 顶 点 ， 另 外 两 个 
顶点 中 的 某 个 顶点 〈 即 折 点 ) 如 果 可 以 同时 和 这 两 个 方块 直 连 ， 就 说 明 可 以 “一 折 连 通 ”。 

3) 两 个 折 点 

这 种 方式 的 两 个 折 点 〈zl、Z2) 必定 在 两 个 目标 点 《两 个 选中 的 方块 ) pl、p2 所 在 的 
x 方向 或 y 方 向 的 直线 上 。 

按 pl1(x1,y]) 点 向 4 个 方向 探测 ,例如 向 右 探 测 , 每 次 x1+1, 判断 z1(x1+1,y1) 和 p2(x2,y2) 
点 可 否 形成 一 个 折 点 连通 性 ， 如 果 可 以 形成 连通 ， 则 两 个 折 点 连通 ， 否 则 直到 超过 图 形 右 
边界 区 域 。 假 如 超过 图 形 右 边界 区 域 ， 则 还 需要 判断 两 个 折 点 在 选中 方块 的 右 侧 ， 且 两 个 
折 点 在 图 案 区 域 之 外 连通 情况 是 否 存在 。 此 时 判断 可 以 简化 为 判断 p2(x2,y2) 是 否 可 以 水 平 
直通 到 边界 。 

经 过 上 面 的 分 析 ， 两 个 方块 是 否 可 以 抵消 的 流程 图 如 图 10-4 所 示 。 
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根据 图 10-4 所 示 的 流程 图 ， 对 选中 的 两 个 方块 (分 别 在 (x1,y1)、(x2,y2) 位 置 ) 是 否 可 
以 抵消 的 判断 如 下 实现 。 把 该 功能 封装 在 IsLink0 方 法 里 面 ， 


判断 选中 


从 入 门 到 实战 一 一 疏 虫 、 游 戏 和 机 器 学 习 


开始 


直 连 方式 判断 
ee 


图 10-4 流程 图 


其 代码 如 下 : 


的 两 个 方块 是 否 可 以 消除 


def IsLink(pl,p2): 
if lineCheck(pl, p2): 


if secondLine (pl, p2): 


if triLine(pl, p2): 


return True 


return True 


return True 


return False 


直 连 方式 分 为 x 或 y 相 同 的 情况 ， 同 行 同 列 情况 消除 的 原理 是 如 果 两 个 相同 的 被 消除 


# 一 个 转弯 〈 折 点 ) 的 连通 方式 


# 两 个 转弯 〈 折 点 ) 的 连通 方式 


方块 之 间 的 空格 数 spaceCount 等 于 它们 的 ( 行 / 列 差 -1)， 则 两 者 可 以 连通 。 


class Point: 
# 点 类 


def init _(self,x,y): 
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Self:x=x 
Self.y=Y 
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* x 代表 列 ，y 代表 行 
* param pl 第 1 个 保存 上 次 选中 点 坐标 的 点 对 象 
* param p2 第 2 个 保存 上 次 选中 点 坐标 的 点 对 象 
# 直 接连 通 
def lineCheck (pl, p2): 
absDistance=0 
spaceCount=0 
if (pl.x==p2.x or pl.y==p2.y) :同行 同 列 吗 
print ("同行 同 列 的 情况 ------ 
坦 同 列 的 情况 
if (pl.x==p2.x and pl.y != p2.y) : 
print (" 同 列 的 情况 ") 
# 绝 对 距离 《中 间隔 着 的 空格 数 ) 
absDistance=abs (pl.y-p2.y)-1 
# 正 / 负 值 
dE Ml yp 
Ls 
LS 
区 下 
for i in range (1,absDistance+1) : 
if (map[pl.x] [pl.y + i * zf]==" "): 
# 空 格 数 加 1 
spaceCount+=1 
LS 
break;# 遇 到 阻碍 就 不 用 再 探测 了 
elif tpl.y==p2.Yy and pi:xl=p2.x): # 同 行 的 情况 
print ("同行 的 情况 ") 
absDistance=abs (pl .x-p2.x)-1 
# 正 / 负 值 
Le ls p23 2 0 
zf==1 
else: 
和 所 
for i in range (1,absDistance+1) : 
if (map[pl.x + i * zf] [pl.y]==" "): 
# 空 格 数 加 1 


spaceCount+=1 


else: 
break; # 遇 到 阻碍 就 不 用 再 探测 了 
if (spaceCount==absDistance) 
坦 可 连通 


print (absDistance, spaceCount) 
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从 入 门 到 实战 一 一 仆 虫 、 游 戏 和 机 器 学 习 
print (" 行 / 列 可 直接 连通 ") 


return True 
else: 
print (" 行 / 列 不 能 消除 ! ") 
return False 
else: 
# 不 是 同行 同 列 的 情况 ， 所 以 直接 返回 False 


return False; 


一 个 折 点 连通 使 用 OneCornerLinkO 实 现 判断 。 其 实 相 当 于 两 个 方块 画 出 一 个 矩形 ， 这 


两 个 方块 是 一 对 对 角 顶 点 ， 见 图 10-5 中 两 个 黑色 目标 方块 的 连通 情况 ,右上 


打 叉 的 位 置 


就 是 折 点 ， 左 下 角 打 叉 的 位 置 不 能 与 左上 角 的 黑色 目标 方块 连通 ， 所 以 不 能 


图 10-5 一 个 折 点 连通 示意 图 


如 果 找 到 ， 则 把 折 点 放 入 linePointStack 列表 中 。 
# 第 2 种 ， 一 个 折 点 连通 (直角 连通 》 


一 个 折 点 连通 
eparam first: 选 中 的 第 1 个 点 
eparam second: 选 中 的 第 2 个 点 


def secondLine(pl, p2): 
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# 第 1 个 直角 检查 点 
checkP=Point (pl .x, p2.y) 
# 第 2 个 直角 检查 点 
checkP2=Point (p2.x, pl.y); 
# 第 1 个 直角 点 检测 


if (map[checkP.x] [checkP.y]==" "): 
if (lineCheck(pl, checkP) and lineCheck (checkP, p2)): 
linePointstack.append (checkP) 
print ("直角 消除 OK", checkP.x,checkP.y) 
return True 
# 第 2 个 直角 点 检测 
if (map[checkP2.x] [checkP2.y]==" "): 
if (lineCheck(pl, checkP2) and lineCheck (checkP2, p2)): 
linePointstack.append (checkP2) 


FE 为 折 点 。 
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print ("直角 消除 OK", checkP2 .x, checkP2.y) 
return True 
print ("不 能 直角 消除 ”) 
return False 
两 个 折 点 连通 ( 双 直 角 连 通 ) 使 用 TwoCormerLink0 实 现 判 断 。 双 直角 连通 的 判定 可 以 
分 两 步 进行 : 
(1) 在 pl 点 周围 的 4 个 方向 寻找 空 块 checkP 点 。 
(2) 调用 OneComerLink(checkP, p2) 检测 checkP 与 p2 点 可 否 形成 一 个 折 点 连通 性 。 
两 个 折 点 连通 即 遍 历 pl 点 周围 4 个 方向 的 空格 ， 使 之 成 为 checkP 点 ， 然 后 调用 
OneCornerLink(checkP, p2) 判 定 是 否 为 真 ， 如 果 为 真 ， 可 以 双 直 角 连 通 ， 若 所 有 的 空格 都 遍 
历 完 还 没有 找到 ， 则 失败 。 
如 果 找 到 ， 则 把 两 个 折 点 放 入 linePointStack 列表 中 。 
# 第 3 种 ， 两 个 折 点 连通 〈 双 直角 连通 ) 
eparam pl 第 1 个 点 
eparam p2 第 2 个 点 


def TwoCornerLink (pl, p2): 
checkP=Point (pl.x, pl.y) 
#4 个 方向 的 探测 开始 
for i in range(0,4): 
CheckP.x=pl.x 
checkP.y=pl.y 
# 向 下 
if (i==3): 
checkP .y+=1 
while( (checkP.y<Height) and map[checkP.x] [checkP.y]==" "): 
linePointstack.append (checkP) 
if (OneCornerLink (checkP, p2)): 
print ("下 探测 OK") 
return True 
slses 
linePointstack .pop() 
CheckP .y+=1 
# 向 右 
elif (i==2): 
cheekp :x+=1 
whilel( (checkP.x<Width) and map[checkP.x] [checkP.y]==" "): 
linePointstack.append (checkP) 
if (OneCornerLink (checkP, p2)): 
print (" 右 探测 OK") 
return True 


LSe 
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linePointstack.pop() 
CheckP .x+=1 
# 向 左 
elif (i==1): 
CheckP .zx-=1 
while( (checkP.x>=0) and map[checkP.x] [checkP.y]==" "): 
linePointstack.append (checkP) 
if (OneCornerLink (checkP, p2)): 
print (" 左 探测 OK") 
return True 
else: 
linePointstack.pop() 
checkPp.zx==1 


# 向 上 
elif (i==0): 
checkP.y-=1 


while( (checkP.y >=0) and map[checkP.x] [checkP.y]==" "): 
linePointstack.append (checkP) 
if (OneCornerLink (checkP, p2)): 
print ("上 探测 OK") 
return True 
Slyes 
linePointstack .pop() 
checkP.y-=1 
#4 个 方向 寻 完 也 没 找到 适合 的 checkP 点 
print ("两 直角 连接 没 找到 适合 的 checkP 点 ") 


return False; 


注意 : 上 面 的 代码 在 测试 两 个 折 点 连通 时 并 没有 考虑 两 个 折 点 都 在 游戏 区 域外 部 的 情 
况 ， 有 些 连连 看 游戏 不 允许 折 点 在 游戏 区 域外 侧 ( 即 边 界外 )。 如 果 允 许 这 种 情况 ,对 上 面 
的 代码 做 如 下 修改 。 


# 向 下 
if (i==3): 
checkP .y+=1 
while( (checkP.y<Height) and map[checkP.x] [checkP.y]==" "): 
linePointstack.append (checkP) 
if (OneCornerLink (checkP, p2)): 
print ("下 探测 OK") 
return True 
SS 
linePointstack.pop() 
CheckP .y+=1 
# 补 充 两 个 折 点 都 在 游戏 区 域 底 侧 外 部 
if checkP.y==Height: # 出 了 底部 ， 仅 需 判 断 p2 能 否 达 到 底部 边界 
z=Point (p2.x,Height-—1) # 底 部 边界 点 
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if lineCheck (z,p2) : # 两 个 折 点 在 区 域外 部 的 底 侧 
linePointstack.append (Point (pl.x, Height)) 
linePointstack.append (Point (p2.x, Height)) 
print ("下 探测 到 游戏 区 域外 部 OK") 


return True 
对 于 其 余 3 个 方向 的 边界 外 部 两 个 折 点 的 连通 情况 判断 ， 请 读者 自己 思考 添加 。 
全 智能 查找 功能 的 实现 


若 要 在 地 图 上 自动 查找 出 一 组 相同 、 可 以 抵消 的 方块 ， 通 常 采 用 遍历 算法 。 下 面 借 助 
10-6 分 析 此 算法 。 


pa 


图 10-6 ”匹配 示意 图 1 


在 图 中 找 相同 的 方块 时 ， 将 按 方 块 地 图 map 的 下 标 位 置 对 每 个 方块 进行 查找 ,一旦 找 
到 一 组 相同 、 可 以 抵消 的 方块 则 马上 返回 。 在 查找 相同 方块 组 的 时 候 ， 必 须 先 确定 第 1 个 
选 定 方块 (例如 0 号 方块 ), 然后 在 这 个 基础 上 做 遍历 查找 第 2 个 选 定 方块 ， 即 从 1 开始 按 
照 1、2、3、4、5、6、7 等 的 顺序 查找 第 2 个 选 定 方块 ， 并 判断 选 定 的 两 个 方块 是 否 连 通 
抵消 ， 假 如 0 号 方块 与 5 号 方块 连通 ， 则 经 过 (0.1)、(0.2)、(0.3)、(0.4)、(0.5) 共 5 组 数据 
的 判断 对 比 ， 若 成 功 立即 返回 。 

如 果 找 不 到 匹配 的 第 2 个 选 定 方块 ， 则 如 图 10-7 (a) 所 示 编 号 加 1 重新 选 定 第 1 个 
方块 ( 即 1 号 方块 ) 进入 下 一 轮 ， 然 后 在 这 个 基础 上 做 遍历 查找 第 2 个 选 定 方块 ， 即 如 图 
10-7 (b) 所 示 从 2 号 开始 按照 2、3、4、5、6、7 等 的 顺序 查找 第 2 个 选 定 方块 ， 直 到 搜 
索 到 最 后 一 块 〈 即 15 号 方块 )。 那 么 为 什么 从 2 开始 查找 第 2 个 选 定 方块 ， 而 不 是 从 0 号 
开始 呢 ? 因为 在 将 1 号 方块 选 定 为 第 1 个 选 定 方块 前 ，0 号 已 经 作为 第 1 个 选 定 方块 对 后 
面 的 方块 进行 可 连通 的 判断 了 ， 它 必然 不 会 与 后 面 的 方块 连通 。 


(a) 0 号 方块 找 不 到 匹配 方块 ， 选 定 1 号 (b) 从 2 号 方块 开始 找 匹 配 
图 10-7 匹配 示意 图 2 


如 果 找 不 到 与 1 号 方块 连通 且 相同 的 方块 ， 则 编号 加 1 重新 选 定 第 1 个 方块 〈 即 2 号 
方块 ) 进入 下 一 轮 ， 从 3 号 开始 按照 3、4、5、6、7 等 的 顺序 查找 第 2 个 选 定 方块 。 
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按照 上 面 设计 的 算法 ， 整 个 流程 图 如 图 10-8 所 示 。 


第 2 个 方块 的 编 


I 断 是 否 最 后 一 个 
j=m_nRow*m nCol 


是 
了 
bFound=True 


剂 断 是 否 最 后 一 个 


i=m_nRow*m_nCol 


找到 后 用 画笔 画 
出 选中 框 线 


返回 bFound 


图 10-8 智能 查找 匹配 方块 的 流程 图 
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根据 流程 图 ， 把 自动 查找 出 一 组 相同 、 可 以 抵消 的 方块 的 功能 封装 在 Find2Block() 方 
法 里 面 ， 其 代码 如 下 : 


def find2Block (event): # 自 动 查找 
global firstSelectRectId,SecondSelectRectId 
m nRoWw=Height 
m nCcol=Width 
bFound=False; 
# 第 1 个 方块 从 地 图 的 0 位 置 开 始 
for i in range(0, m nRoW* m nCol): 
# 找 到 则 跳出 循环 
if (bFound): 
break 
# 算 出 对 应 的 虚拟 行 / 列 位置 
X1=igsm nCol 
yl=i//m ncol 
pl=Point (x1, yl1) 
# 无 图 案 的 方块 跳 过 
if (map[x1] [y1]==" '): 


continue 
# 第 2 个 方块 从 前 一 个 方块 的 后 面 开始 
for j in range(i+l, m nRoW* m nCol): 
# 算 出 对 应 的 虚拟 行 / 列 位置 
Xx2=j%m nCol 
y2=j//m ncol 
p2=Point (x2, y2) 
# 第 2 个 方块 不 为 空 ， 且 与 第 1 个 方块 的 图 标 相同 
if (map [x2] [Y2]!=' ' and IsSame (pl,p2)): 
# 判 断 是 否 可 以 连通 
4 ISDink(BLs D2))2 
bFound=True; 
break 
# 找 到 后 
if (bFound) : #Pp1 (xl1, y1) 与 p2 (x2,y2) 连通 
print (" 找 到 后 ",p1.xv,p1.Yyvp2.x,p2.Y) 
# 画 选 定 (x1, y1) 处 的 框 线 
firstselectRectId=cv. create rectangle (x1*40,y1*40,xl1*40+40, 
yl*40+40, width=2, outline="red") 
# 画 选 定 (x2, y2) 处 的 框 线 
secondSselectRectId=cv.create rectangle (x2*40,y2*40,x2*40+40, 
y2*40+40,outline="red") 
#t=Timer (timer interval,delayrun) # 定 时 函数 自动 消除 
#t.start () 
return bFound 
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10.3 ”关键 技术 
10.3.1 ”图形 绘制 一 一 Tinker 的 Canvas 组 件 家 


视频 讲解 
Tinker 的 Canvas (画布 ) 是 一 个 长 方形 区 域 ， 用 于 图 形 绘制 或 复杂 的 图 
形 界面 布局 。 用 户 可 以 在 画布 上 绘制 图 形 、 创 建文 字 、 放 置 各 种 组 件 和 框架 。 
@ 创建 Canvas 对 象 
用 户 可 以 使 用 下 面 的 方法 创建 一 个 Canvas 对 象 。 
Canvas 对 象 =Canvas (窗口 对 象 ， 选 项 ，... ) 
其 常用 选项 如 表 10-1 所 示 。 
表 10-1 Canvas 的 常用 选项 
属 性 说 明 
bd 指定 画布 的 边框 宽度 ， 单 位 是 像素 
bg 指定 画布 的 背景 颜色 
confine 指定 画布 在 滚动 区 域外 是 否 可 以 滚动 ， 默 认为 Tmue， 表 示 不 能 滚动 
cursor 指定 画布 中 的 鼠标 指针 ， 例 如 arow、circle、dot 
height 指定 画布 的 高 度 
highlightcolor 选中 画布 时 的 背景 色 
Telief 指定 画布 的 边框 样式 ， 可 选 值 有 SUNKEN、RAISED、GROOVE、RIDGE 
scrollregion 指定 画布 的 滚动 区 域 的 元 组 (wan,e,s) 


四 显示 Canvas 对 象 

显示 Canvas 对 象 的 方法 如 下 : 

Canvas 对 象 .pack() 

例如 创建 一 个 白色 背景 、 宽 300、 高 120 的 画布 。 


from tkinter import * 

root=TKk () 

cv=Canvas (root, bg='white', width=300, height=120) 
cv.create line(10,10,100,80,width=2，dash=7) ”# 绘 制 直线 
cv.pack() # 显 示 画 布 
root .mainloop () 


10.3.2 ”Canvas 上 的 图 形 对 象 


在 Canvas 上 可 以 绘制 各 种 图 形 对 象 ， 通 过 调用 以 下 绘制 函数 实现 。 
。 create_arc(): 绘制 圆 弧 。 
。 create_line(): 绘制 直线 。 
。 create_bitmap(): 绘制 位 图 。 
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create_image(): 绘制 位 图 图 像 。 

。 create_oval(): 绘制 椭圆 。 

。 create_rectangle(): 绘制 矩形 。 

。 create polygon(0: 绘制 多 边 形 。 

。 create window(0: 绘制 子 窗口 。 

。 create_text(): 创建 一 个 文字 对 象 。 

Canvas 上 的 每 个 绘制 对 象 都 有 一 个 标识 ID (整数 )， 在 使 用 绘制 函数 创建 绘制 对 象 时 
绘制 对 象 IJD。 例 如 : 


idl=cv.create line(10,10,100,80,width=2，dash=7) ， 间 绘 制 直线 

通过 ID1 可 以 得 到 绘制 对 象 直 线 了 DD。 

在 创建 图 形 对 象 时 可 以 使 用 tags 属性 设置 图 形 对 象 的 标记 (tag)， 例 如 : 
rt=cv.create rectangle(10,10,110,110, tags="'r1') 

上 面 的 语句 指定 矩形 对 象 区 具有 一 个 标记 了 1。 

有 户 也 可 以 同时 设置 多 个 标记 ， 例 如 : 

rt=cv.create rectangle(10,10,110,110, tags=('r1','r2','r3')) 

上 面 的 语句 指定 矩形 对 象 区 具有 3 个 标记 fl、r2、r3。 

在 指定 标记 后 ， 使 用 find_withtag() 方 法 可 以 获取 到 指定 tag 的 图 形 对 象 ， 然 后 设置 图 


-mn 


形 对 象 的 属性 。find_withtag0) 方 法 的 语法 如 下 : 


Canvas 对 象 .find withtag (tag 名 ) 

find_withtag() 方 法 返回 一 个 图 形 对 象 数组 ， 其 中 包含 所 有 具有 tag 名 的 图 形 对 象 。 
使 用 itemconfig0 方 法 可 以 设置 图 形 对 象 的 属性 ， 语 法 如 下 : 

Canvas 对 象 .itemconfig (图 形 对 象 ， 属 性 1= 值 1， 属 性 2= 值 2…) 

[ 贺 10-1 使 用 tags 属性 设置 图 形 对 象 标记 。 


from tkinter import * 
root=TKk () 
# 创 建 一 个 canvas， 设 置 其 背景 色 为 白色 
cv=Canvas (root, bg='white', width=200, height=200) 
# 使 用 tags 给 第 1 个 矩形 指定 3 个 tag 
rt=cv.create rectangle(10,10,110,110, tags=("'r1l','r2°','r3')) 
cv.pack() 
cv.create rectangle(20,20,80,80, tags ='r3')# 使 用 tags 给 第 2 个 矩形 指定 一 个 tag 
# 将 所 有 与 tag ('r3' ) 绑 定 的 item 边框 的 颜色 设置 为 蓝 色 
for item in cv.find withtag('r3'): 
cv.itemconfig (item,outline='blue') 
root .mainloop () 


下 面 学 习 使 用 绘制 函数 绘制 各 种 图 形 对 象 及 对 图 形 对 象 进行 修改 等 操作 。 
@ 绘制 圆 弥 
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使 用 create_arc() 方 法 可 以 创建 一 个 圆 弧 对 象 ， 可 以 是 一 个 弦 、 饼 图 扇 区 或 者 是 一 个 简 
单 的 弧 ， 具 体 语法 如 下 : 


Canvas 对 象 .create arc ( 弧 外 框 矩形 左上 角 的 x 坐标 ， 弧 外 框 矩 形 左 上 角 的 y 坐标 ， 弧 外 框 
和 拢 形 右 下 角 的 六 坐标 ， 驶 外 框 矩形 右 下 角 的 Y 坐 标 ， 选 项 ，- - .) 


创建 圆 弧 时 的 常用 选项 ;outline 指定 圆 弧 边框 的 颜色 ，fill 指定 填充 颜色 ，width 指定 
辐 弧 边框 的 宽度 ，start 代表 起 始 角度 ，extent 代表 指定 角度 偏 移 量 而 不 是 终止 角度 。 
[ 辑 102 使 用 create_arc() 方 法 创建 圆 弧 ， 运 行 效果 如 图 10-9 所 示 。 


from tkinter import * 
root=Tk() 
# 创 建 一 个 canvas， 设 置 其 背景 色 为 白色 
cv=Canvas (root,bg='white') 
cv.create arc((10,10,110,110),) # 使 用 默认 参数 创建 一 个 圆 弧 ， 结 果 为 90” 的 扇形 
d={1:PIESLICE, 2:CHORD, 3:ARC} 
For mn ds 
# 使 用 3 种 样式 ， 分 别 创建 了 扇形 、 马 形 和 弧 形 
cv.create arc((10,10+60*i,110,110+60*i),style=d[i]) 
print (i,d[i]) 
# 使 用 start/extent 指定 圆 弧 起 始 角 度 与 偏 移 角 度 
cv.create arcl( 
(150,150,250,250) ， 


start=10, # 指 定 起 始 角 度 
extent=120 # 指 定 角度 偏 移 量 ( 逆 时 针 》 
) 

cv.pack() 


root .mainloop () 


图 10-9 ”创建 圆 弧 


外 绘制 线条 
使 用 create_line0 方 法 可 以 创建 一 个 线条 对 象 ， 具 体 语法 如 下 : 


line=canvas.create line (X0，Y0，xl1，yY1，…，xn，yn， 选 项 ) 


参数 (x0, y0)，(xl, y1)，…，(xn, yn) 是 线段 的 端点 。 
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创建 线段 时 的 常用 选项 : width 指定 线段 宽度 ，arrow 指定 是 否 使 用 箭头 〈 没 有 箭头 为 


none, 起 点 有 箭头 为 first, 终点 有 箭头 为 last, 两 端 有 箭头 为 both), fill 指定 线段 颜色 , dash 


指定 线段 为 虚线 〈 其 整数 值 决 定 虚线 的 样式 )。 


[ 辑 10-3 使 用 create_line() 方 法 创建 线条 ， 运 行 效果 如 图 10-10 所 示 。 


from tkinter import * 


Foot=TK() 

cv=Canvas (root, bg='white', width=200, height=100) 

cv.create line(10, 10, 100, 10, arrow='none') # 绘 制 没有 箭头 的 线段 
cv.create line(10, 20, 100, 20, arrow="'first') ## 绘 制 起 点 有 箭头 的 线段 
cv-create line(10, 30, 100, 30, arrow='last') # 绘 制 终点 有 箭头 的 线段 
cv.create line(10, 40, 100, 40, arrow='both') # 绘 制 两 端 有 箭头 的 线段 
cv.create line(10,50,100,100,width=3, dash=7) # 绘 制 虚线 

cv.pack() 


root .mainloop () 


图 10-10 创建 线条 


@ 绘制 矩形 
使 用 create_rectangle() 方 法 可 以 创建 矩形 对 象 ， 具 体 语法 如 下 : 


Canvas 对 象 .create_rectangle (矩形 左上 角 的 x 坐标 ， 和 矩形 左上 角 的 y 坐标 ， 和 矩形 右 下 角 
的 x 坐标， 矩形 右 下 角 的 y 坐标 ， 选 项 ，. . .) 


创建 矩形 对 象 时 的 常用 选项 : outline 指定 边框 颜色 ,fl 指定 填充 颜色 ，width 指定 边 


框 的 宽度 ，dash 指定 边框 为 虚线 ，stipple 使 用 指定 自 定义 画 刷 填充 矩形 。 


[ 贺 10-4 使 用 create_rectangle0 方 法 创建 算 形 ， 运 行 效果 如 图 10-11 所 示 。 


from tkinter import * 
Foot=TK() 
# 创 建 一 个 canvas， 设 置 其 背景 色 为 白色 
cv=Canvas (root, bg='white', width=200, height=100) 
cv.create rectangle(10,10,110,110, width =2,fill='red') 
# 指 定 拢 形 的 填充 色 为 红色 、 宽 度 为 2 
cv.create rectangle(120，20，180，80，outline='green')# 指 定 矩形 的 边框 颜色 为 绿色 
cv.pack() 


root .mainloop () 
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图 10-11 创建 矩形 对 象 


@ 绘制 多 边 形 

使 用 create_polygon() 方 法 创建 一 个 多 边 形 对 象 ， 可 以 是 一 个 三 角形 、 和 矩形 或 者 任意 一 
个 多 边 形 ， 具 体 语 法 如 下 : 

Canvas 对 象 . create polygon (顶点 1 的 xx 坐标， 顶点 1 的 y 坐 标 ， 顶 点 2 的 x 坐标， 顶点 

2 的 Y 坐 标 ，…， 项 点 n 的 xx 坐标 ， 项 点 n 的 Y 坐 标 ， 选 项 ，…) 


创建 多 边 形 对 象 时 的 常用 选项 : outline 指定 边框 颜色 ，fill 指定 填充 颜色 ，width 指定 
边框 的 宽度 ，smooth 指定 多 边 形 的 平滑 程度 (等 于 0 表示 多 边 形 的 边 是 折线 ， 等 于 1 表示 
多 边 形 的 边 是 平滑 曲线 )。 

[加 10-5 创建 三 角形 、 正 方形 、 对 顶 三 角形 ， 运 行 效果 如 图 10-12 所 示 。 


from tkinter import * 

root=TKk () 

cv=Canvas (root, bg='white', width=300, height=100) 

cv.create polygon(35,10,10,60,60,60, outline='blue',fill='red', width=2) 
# 等 腰 三 角形 

cv.create polygon(70,10,120,10,120,60,outline='blue', fill="'white',width=2) 
# 直 角 三 角形 

cv.create polygon (130,10,180,10,180,60,130,60，width=4) “ 间 黑 色 填 充 正方 形 

cv.create polygon (190,10,240,10,190,60,240,60，width=1) 对 项 三 角形 

cv.pack() 


root .mainloop () 


tk | 


全 、| 转 入 


ee 


图 10-12 创建 三 角形 、 正 方形 、 对 顶 三 角形 


人 绘制 椭圆 
使 用 create_oval( 方 法 可 以 创建 一 个 椭圆 对 象 ， 具 体 语法 如 下 : 


Canvas 对 象 .create _oval ( 包 侍 椭圆 的 矩形 左上 角 x 坐标 ， 包 里 椭 圆 的 矩形 左上 角 y 坐标 ， 包 


| 
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右 椭 圆 的 算 形 右 下 角 x 坐标 ， 包 事 椭 圆 的 矩形 右 下 角 y 坐标 ， 选 项 ，... ) 

创建 椭圆 对 象 时 的 常用 选项 ;outline 指定 边框 颜色 ，fiL 指定 填充 颜色 ，width 指定 边 
框 的 宽度 。 如 果 包 囊 椭 圆 的 矩形 是 正方 形 ， 则 绘制 的 是 一 个 圆 形 。 

[ 贺 10-6 创建 椭圆 和 国 形 ， 运 行 效果 如 图 10-13 所 示 。 


from tkinter import * 

root=TKk () 

cv=Canvas (root, bg="'white', width=200, height=100) 

cv.create oval(10,10,100,50, outline='blue', fill='red', width=2) 彬 圆 
cv.create oval (100,10,190,100，outline='blue'，fil1='red'，width=2)# 圆 形 
cv.pack() 


Foot .mainloop () 


图 10-13 ”创建 椭圆 和 圆 形 


@ 创建 文字 

使 用 create text( 方 法 可 以 创建 一 个 文字 对 象 ， 具 体 语 法 如 下 : 

文字 对 象 =canvas 对 象 .create text( (文本 左上 角 的 x 坐标 , 文本 左上 角 的 y 坐标 ) ， 选 
项 ，…) 


创建 文字 对 象 时 的 常用 选项 : text 是 文字 对 象 的 文本 内 容 ，fill 指定 文字 颜色 ，anchor 
控制 文字 对 象 的 位 置 (其 取 值 'w' 表 示 左 对 齐 ，'e' 表 示 右 对 齐 ，n' 表 示 顶 对 齐 ，'s' 表 示 底 对 
齐 ，"mnw' 表 示 左 上 对 齐 ，'sw' 表 示 左 下 对 齐 ，'se' 表 示 右 下 对 齐 ，"ne' 表 示 右 上 对 齐 ，'center' 
表示 居中 对 齐 ，anchor 的 默认 值 为 'center')，justify 设置 文字 对 象 中 文本 的 对 齐 方式 (其 取 
值 left 表 示 左 对 齐 ，Tight 表 示 右 对 齐 ，'center 表 示 居 中 对 齐 ，justify 的 默认 值 为 'center')。 
[ 贺 10-7 创建 文本 ， 运 行 效果 如 图 10-14 所 示 。 


from tkinter import * 

Foot=TK() 

cv=Canvas (root, bg='white', width=200, height=100) 

cv.create text((10,10), text='Hello Python', fill='red', anchor='nw') 
cv.create text((200,50), text=" 你 好 ，Python'，fill='blue'，, anchor='se') 
cv.pack() 


root .mainloop () 
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select_from() 方 法 用 于 指定 选中 文本 的 起 始 位 置 ， 具 体 语法 如 下 : 
Canvas 对 象 .select from (文字 对 象 ， 选 中 文本 的 起 始 位 置 ) 

select to() 方 法 用 于 指定 选中 文本 的 结束 位 置 ， 具 体 语 法 如 下 : 
Canvas 对 象 .select_to (文字 对 象 ， 选 中 文本 的 结束 位 置 ) 

[ 贺 10-8 选中 文本 的 例子 ， 运 行 效果 如 图 10-15 所 示 。 


from tkinter import * 

root=Tk () 

cv=Canvas (root, bg="'white', width=200, height=100) 

txt=cv.create text ( (10,10)，text=' 中 原 工学 院 计 算 机 学 院 '，fill='red'，anchor="'nw') 
# 设 置 选 中 文本 的 起 始 位 置 

cv.select from(txt,5) 

# 设 置 选 中 文本 的 结束 位 置 

cv.select to (txt, 9) # 选 中 “计算 机 学 院 ” 

cv.pack() 


root .mainloop () 


Hello Python 


你 好 ,Python 


图 10-14 创建 文本 图 10-15 选中 文本 


@ 绘制 位 图 和 图 像 

1) 绘制 位 图 

使 用 create_bitmap() 方 法 可 以 绘制 Python 内 置 的 位 图 ， 具 体 语 法 如 下 : 
Canvas 对 象 . create_bitmap ( (x 坐标 ,y 坐标 ) , bitmap= 位 图 字符 串 ， 选 项 ，…) 


(x 坐标 ,y 坐标 ) 是 位 图 放置 的 中 心 坐 标 ,常用 选项 :bitmap、activebitmap 和 disabledbitmap 

分 别 用 于 指定 正常 、 活 动 、 禁 用 状态 显示 的 位 图 。 
2) 绘制 图 像 
在 游戏 开发 中 需要 使 用 大 量 图 像 ， 采 用 create_bitmap() 方 法 可 以 绘制 图 形 图 像 ， 有 具体 
语法 如 下 : 

Canvas 对 象 .create image ( (x 坐标 ,y 坐标 ) ， image= 图 像 文件 对 象 ， 选 项 ，…) 

(x 坐标 ,y 坐标 ) 是 图 像 放 置 的 中 心 坐 标 。 常 用 选项 : image、activeimage 和 disabled image 
于 指定 正常 、 活 动 、 禁 用 状态 显示 的 图 像 。 
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注意 : 使 用 PhotoImage(O 函 数 来 获取 图 像 文 件 对 象 。 

imgl=PhotoImage (file= 图 像 文件 ) 

例如 ，img1=PhotoImage(file='C:\aa.png') 获取 笑脸 图 形 。Python 支持 的 图 像 文件 格式 
一 般 为 png 和 .gif。 

[ 贺 10-9 绘制 图 像 示 例 ， 运 行 效果 如 图 10-16 所 示 。 


from tkinter import * 


root=TKk () 

cv=Canvas (root) 

imgl=PhotoImage (file='C:\\aa.png') # 笑 脸 
img2=PhotoImage (file='C:\\2.gif') # 方 块 R 
img3=PhotoImage (file='C:\\3.gif') # 梅 花 R 
cv.create image((100,100) ,image=imgl) 井 绘制 笑脸 
cv.create _ image((200,100) ,image=img2) # 绘 制 方块 A 
cv.create image((300,100),image=img3) # 绘 制 梅 花 A 


d={1:'error',2:'info',3:'question',4:'hourglass',5:'questhead', 
6:'warning',7:'gray12',8:'gray25',9:'gray50',10:'gray75'} # 字 典 
#cv.create bitmap((10,220),bitmap=d[1]) 
# 以 下 遍历 字典 绘制 Python 内置 的 位 图 
FOr 1 An A: 
cv.create bitmap((20*i,20),bitmap=d[i]) 
cv.pack() 
root .mainloop () 


站 
Oi?me! 


图 10-16 绘制 图 像 示 例 
在 学 会 绘制 图 像 之 后 ， 就 可 以 开发 图 形 版 的 扑克 牌 、 连 连 看 、 推 箱子 等 游戏 了 。 


和 @@ 修改 图 形 对 象 的 坐标 

使 用 coords() 方 法 可 以 修改 图 形 对 象 的 坐标 ， 有 具体 语法 如 下 : 

Canvas 对 象 .coords (图 形 对 象 ，( 图 形 左 上 角 的 x 坐 标 ， 图 形 左上 角 的 Y 坐 标 ， 图 形 右 下 角 的 工 
坐标 ， 图 形 右 下 角 的 Y 坐标 ) ) 

因为 可 以 同时 修改 图 形 对 象 的 左上 角 的 坐标 和 右 下 角 的 坐标 ， 所 以 可 以 缩放 图 形 
对 象 。 
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注意 : 如 果 图 形 对 象 是 图 像 文 件 ， 则 只 能 指定 图 像 的 中 心 点 坐标 ， 而 不 能 指定 图 像 对 
象 左上 角 的 坐标 和 右 下 角 的 坐标 ， 故 不 能 缩放 图 像 。 
贺 10-10 修改 图 形 对 象 的 坐标 示例 ， 运 行 效果 如 图 10-17 所 示 。 


from tkinter import * 


Foot=TK() 

cv=Canvas (root) 

imgl=PhotoImage (file='C:\\aa.png') 笑脸 
img2=PhotoImage (file='C:\\2.gif') # 方 块 A 
img3=PhotoImage (file='C:\\3.gif') # 梅 花 R 
rtl=cv.create image((100,100),image=img1) # 绘 制 笑 脸 
rt2=cv.create image((200,100),image=img2) # 绘 制 方块 A 
rt3=cv.create image((300,100),image=img3) # 绘 制 梅花 A 

# 重 新 设置 方块 A (rt2 对 象 ) 的 坐标 

cv.coords (rt2, (200, 50)) # 调 整 rt2 对 象 的 位 置 
rt4=cv.create rectangle(20,140,110,220,outline='red', fill="'green') 间 正 方形 对 象 
cv.coords (rt4, (100,150, 300, 200)) # 调 整 rt4 对 象 的 位 置 
cv.pack() 


Foot .mainloop() 


ri 


9 
区 后 
” 


图 10-17 调整 图 形 对 象 位 置 之 前 和 之 后 的 效果 


人 @ 移动 指定 图 形 对 象 
使 用 move0 方 法 可 以 移动 图 形 对 象 的 坐标 ， 具 体 语 法 如 下 : 


Canvas 对 象 .move (图 形 对 象 ，x 坐标 偏 移 量 ，y 坐标 偏 移 量 ) 
贺 10-1 移动 指定 图 形 对 象 示例 ， 运 行 效果 如 图 10-18 所 示 。 


from tkinter import * 

root=Tk () 

# 创 建 一 个 canvas， 设 置 其 背景 色 为 白色 

cv=Canvas (root, bg="'white', width=200, height=120) 

rtl=cv.create rectangle(20,20,110,110,outline='red', stipple='grayl2', 


fill='green') 
cv.pack() 
rt2=cv.create rectangle(20,20,110,110,outline='blue') 
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cv.move (rt1, 20,-10) # 移 动 rt1 
cv.pack() 


root .mainloop () 


为 了 对 比 移动 图 形 对 象 的 效果 ， 程 序 在 同一 位 置 绘 制 了 两 个 矩形 ， 其 中 和 矩形 rtl 有 背 


景 花纹 ， 和 矩形 rt2 无 背景 填充 ， 然 后 用 move0) 方 法 移动 rl， 将 被 填充 的 矩形 rtl 向 右 移动 
20 像素 、 向 上 移动 10 像素 ， 则 出 现 如 图 10-18 所 示 的 效果 。 


人 @ 出 除 图 形 对 象 
使 用 delete 0 方法 可 以 删除 图 形 对 象 ， 具 体 语法 如 下 : 


Canvas 对 象 .delete (图 形 对 象 ) 


例如 : 

cv.delete (rt1) # 删 除 rtl 图 形 对 象 

图 缩放 图 形 对 象 

使 用 scale() 方 法 可 以 缩放 图 形 对 象 ， 具 体 语法 如 下 ; 


Canvas 对 象 .scale (图 形 对 象 ,X 轴 偏 移 量 , Y 轴 偏 移 量 ,X 轴 缩 放 比 例 ,Y 轴 缩 放 比 例 ) 
[ 辑 10-12 缩放 图 形 对 象 示 例 ， 对 相同 图 形 对 象 放大 、 缩 小 ， 运 行 效果 如 图 10-19 


所 示 。 


from tkinter import * 

root=TKk () 

# 创 建 一 个 Canvas， 设置 其 背景 色 为 白色 

cv=Canvas (root, bg='white', width=200, height=300) 

rtl=cv.create rectangle(10,10,110,110,outline='red', stipple='gray1l2', 
fill='green') 

rt2=cv.create rectangle(10,10,110,110,outline='green', stipple='grayl2', 
fill='red') 


ev scale (rt 0 Or Le2) #Y 方向 放大 一 倍 
cvscale (rt2,0,0,0.5,085) # 缩 小 一 半 大 小 
cv.pack() 


Foot .mainloop() 


图 10-18 移动 指定 图 形 对 象 运行 效果 图 10-19 ”缩放 图 形 对 象 运行 效果 
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10.4 程序 设计 的 步骤 


@ 设计 点 类 Point 
点 类 Point 比较 简单 ， 主 要 存储 方块 所 在 棋盘 的 坐标 (x, y)。 


视频 讲解 


class Point: # 点 类 
def init _(self,x,y): 
Self .x=x 
self.y=y 
四 设计 游戏 主 逻 辑 
整个 游戏 在 Canvas 对 象 中 ， 调 用 create_ map0 实 现 将 图 标 图 案 随 机 放 到 地 图 中 ， 地 图 
map 中 记录 的 是 图 案 的 数字 编号 ， 最 后 调用 print_map() 按 地 图 map 中 记录 的 图 案 信 息 将 
图 10-2 中 的 图 标 图 案 绘 制 在 Canvas 对 象 中 ， 生 成 游戏 开始 的 界面 ， 同 时 绑 定 Canvas 对 象 
的 鼠标 左 键 和 右键 事件 ， 并 进入 窗 体 显 示 线 程 中 。 
Toot=TK() 
root .title ("python 连连 看 ") 
imgs=[PhotoImage (file='H:\\ 连 连 看 \\gif\\bar 0'+str(i)+'.gif') for i in 


range (0,10)] # 所 有 图 标 图 案 

Select first=False # 是 否 已 经 选中 第 1 块 
firstselectRectId=-1 # 被 选中 第 1 块 地 图 对 象 
SecondSelectRectId=-1 # 被 选中 第 2 块 地 图 对 象 
linePointstack=[] # 存 储 连接 的 折 点 棋盘 坐标 
Line id=[] 

Height=9 

Width=10 


map=[[" " for y in range (Height)]for x in range (Width)] 

image map=[[" " for y in range(Height)]for x in range (Width)] 
cv=Canvas (root, bg='green', width=610, height=610) 
cv.bind("<Button-1>", callback) # 鼠 标 左 键 事 件 
cv.bind("<Button-3>"，find2Block) 才 鼠 标 右键 事件 


cv.pack() 

create map() # 产 生 map 地 图 
print map() # 打 印 map 地 图 
root .mainloop () 

全 编 与 函数 代码 


print_map() 按 地 图 map 中 记录 的 图 案 信 息 将 图 10-2 中 的 图 标 图 案 显 示 在 Canvas 对 象 

中 ， 生 成 游戏 开始 的 界面 。 

def print map(): # 输 出 map 地 图 
global image map 


for x in range(0,Width) : 
for y in range(0,Height) : 
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if (map[x] [y] !=" '): 
imgl=imgs [int (map[x] [y])] 
id=cv.create image((x*40+20,y*40+20),image=img1) 
image map [x] [y]=id 
cv.pack() 
for y in range (0,Height) : 
for x in range(0,Width) : 
print (map[zx] [Y] ,end="” ') 
Prin ey) 


户 在 窗口 中 单 击 时 ， 由 屏幕 像素 坐标 (event.x,event.y) 计 算 被 单 击 方块 的 地 图 棋盘 位 


E 标 (x,y)。 判 断 是 否 为 第 1 次 选中 方块 ， 是 则 仅仅 对 选 定 方块 加 上 蓝 色 的 示意 框 线 。 如 


果 是 第 2 次 选中 方块 ， 则 加 上 黄色 的 示意 框 线 ， 同 时 要 判断 是 否 图 案 相同 且 连 通 。 假 如 连 


通则 画 


选中 方块 之 间 的 连接 线 , 延 时 0.3 秒 后 清除 第 1 个 选 定 方块 和 第 2 个 选 定 方块 图 案 ， 


并 清除 选中 方块 之 间 的 连接 线 。 假 如 不 连通 ， 则 是 清除 选 定 两 个 方块 示意 框 线 。 


Canvas 对 象 鼠标 右键 事件 调用 智能 查找 功能 Find2Block(。 


def find2Block(event) : 自动 查找 


# 见 前 面 程序 设计 的 思路 


Canvas 对 象 鼠标 左 键 事件 代码 : 
def callback (event): # 鼠 标 左 键 事件 代码 


global Select first,pl,p2 

global firstSelectRectId, SecondSelectRectId 
#print ("clicked at", event.x, event.y,turn) 
x= (event .x)//40 # 换 算 棋盘 坐标 
y=(event.y)//40 

print(t"clicked at, YY) 


if map[x] [y]==" ™: 
showinfo (title=" 提 示 ",message=" 此 处 无 方块 ") 
SLse: 
if Select first==False: 
pl=Point (x, y) 
# 画 选 定 (x1, y1) 处 的 框 线 
firstselectRectId=cv.create rectangle (x*40, y*40, x*40+40, y*40+ 
40,out1line="blue") 
Select first=True 
else: 
P2=Point (x, y) 
# 判 断 第 2 次 单 击 的 方块 是 否 已 被 第 1 次 单 击 选取 ， 如 果 是 则 返 
if (pl.x==p2.x) and (pl.y==p2.y): 


回 


return 
# 画 选 定 (x2, y2) 处 的 框 线 
print (' 第 2 次 单 击 的 方块 '， x, y) 
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SecondSelectRectId=cv.create rectangle (x*40,y*40,x*40+40, y*40 
+40,o0utline="yellow") 
Print (' 第 2 次 单 击 的 方块 ',SecondSselectRectId) 
cv.pack() 
if IsSame (pl,p2) and IsLink (pl,p2) : 坦 判断 是 否 连通 
print (' 连 通 ' ,x, y) 
Select first=False 
# 画 选中 方块 之 间 的 连接 线 
drawLinkLine (pl,p2) 
t=Timer (timer interval,delayrun) # 定 时 函数 


tstart() 
else: # 不 能 连通 则 取消 选 定 的 两 个 方块 
cv.delete (firstselectRectId) # 清 除 第 1 个 选 定 框 线 


cv.delete (SecondSelectRectId) # 清 除 第 2 个 选 定 框 线 
Select first=False 


IsSame(p1,p2) 判 断 pl (x1, y1) 和 p2(x2, y2) 处 的 方块 图 案 是 否 相 同 。 
def IsSame (pl,p2): 
if map[pl.x] [pl.y]==map[p2.x] [p2.y]: 
print ("clicked at IsSame") 
return True 
return False 


以 下 是 画 方块 之 间 的 连接 线 和 清除 连接 线 的 方法 。 

drawLinkLine(p1.p2) 绘 制 p1.p2) 所 在 两 个 方块 之 间 的 连接 线 。 判 断 linePointStack 列表 
长 度 , 如 果 为 0, 则 是 直接 连通 ; linePointStack 列表 长 度 为 1, 则 是 一 折 连 通 , linePointStack 
存储 的 是 一 折 连 通 的 折 点 ; linePointStack 列表 长 度 为 2， 则 是 两 折 连 通 ，linePointStack 存 
储 的 是 两 折 连 通 的 两 个 折 点 。 


def drawLinkLine (pl,p2): # 画 连接 线 
if(len(linePointstack)==0): 
Line id.append (drawLine (pl1,p2)) 
人 
print (linePointstack, len(linePointstack)) 
if(len(linePointstack)==1): 
z=linePointstack.pop() 
print ("一 折 连 通 点 z",z.x,z.y) 
Line id.append (drawLine (pl, 7z)) 
Line id.append (drawLine (p2, z)) 
if(len(linePointstack)==2): 
zl1=linePointstack.pop() 
print ("两 折 连 通 点 z1", zl1.x,z1.y) 
Line id.append (drawLine (p2,2z1)) 
Zz2=linePointstack.pop() 
print ("两 折 连 通 点 z2", z2.x,z2.y) 
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Line id.append (drawLine(z1,z2)) 
Line id.append (drawLine (pl,z2)) 


drawLinkLine(p1.p2) 绘 制 p1.p2) 之 间 的 直线 。 


def drawLine (pl,p2): 
print ("drawLine pl,p2",pl.x,pl.y,p2.x,p2.y) 
id=cv.create line (pl .x*40+20,pl.y*40+20,p2.x*40+20,p2.y*40+20,width=5, 
fill='red') 
#cv.pack() 
return id 


undrawConnectLine() 删 除 Line_id 记录 的 连接 线 。 


def undrawConnectLine() : 
while len(Line id)>0: 
idpop=Line id.pop() 
cv.delete (idpop) 


clearTwoBlockO 清 除 p1,p2) 之 间 的 连 线 及 所 在 方块 的 图 案 。 


def clearTwoBlock() : # 清 除 连 线 及 方块 
# 清 除 第 1 个 选 定 框 线 
cv.delete (firstSelectRectId) 
# 清 除 第 2 个 选 定 框 线 
cv.delete(SecondSelectRectId) 
# 清 空 记录 方块 的 值 


map[pl.x] [pl.y]=" " 

cv.delete (image map[pl1.x] [pl.y]) 
map[p2.x] [p2.y]=" " 

cv.delete (image map[p2.x] [p2.y]) 
Select first=False 


undrawConnectLine () # 清 除 选中 方块 之 间 的 连接 线 


delayrun() 函 数 是 定时 函数 ， 延 时 timer interval (0.3 秒 ) 后 清除 p1.p2) 之 间 的 连 线 及 
所 在 方块 的 图 案 。 


timer interval=0.3 #0.3 秒 
def delayrun () : 
clearTwoBlock () # 清 除 连 线 及 方块 


IsWin0 检 测 是 否 尚 有 未 被 消除 的 方块 ， 即 地 图 map 中 的 元 素 值 非 空 (" )， 如 果 没有 
则 表示 已 经 赢得 了 游戏 。 


# 检 测 是 否 已 经 赢得 了 游戏 


def IsWin() 
坦 检测 是 否 尚 有 未 被 消除 的 方块 


213 | 


hon 项 目 案例 开发 
从 入 门 到 实战 一 一 爬虫 、 游 戏 和 机 器 学 习 
#( 非 BLANK STATE 状态 ) 
for y in range (0,Height) : 
for x in range(0,Width) : 
if map[i]!=" "™): 
return False; 

return True; 
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经 典 的 推 箱子 游戏 是 一 个 来 自 日 本 的 古老 游戏 ， 目 的 是 训练 玩家 的 逻 
辑 思考 能 力 。 该 游戏 的 思想 是 ， 在 一 个 狭小 的 仓库 中 ， 要 求 把 木 箱 放 到 指定 的 位 置 ， 玩 家 
稍 不 小 心 就 会 出 现 箱子 无 法 移动 或 者 通道 被 堵 住 的 情况 ， 所 以 需要 巧妙 地 利用 有 限 的 空间 
和 通道 合理 安排 移动 的 次 序 和 位 置 ， 这 样 才能 顺利 地 完成 任务 。 

推 箱子 游戏 的 功能 如 下 : 

游戏 运行 载 入 相应 的 地 图 ， 屏 幕 中 出 现 一 个 推 箱子 的 工人 ， 其 周围 是 围墙 畏 、 人 可 以 
走 的 通道 图 、 几 个 可 以 移动 的 箱子 萎 和 箱子 放置 的 目的 地 区 。 让 玩家 通过 按 上 、 下 、 左 、 
右键 控制 工人 名 推 箱子 ， 当 箱子 都 推 到 了 目的 地 后 出 现 过 关 信 息 ， 并 显示 下 一 关 。 如 果 推 
错 了 ， 玩 家 按 空格 键 重新 玩 过 这 关 ， 直 到 过 完全 部 关卡 。 

本 章 开发 推 箱子 游戏 ， 推 箱子 游戏 界面 如 图 11-1 所 示 。 
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图 11-1 推 箱子 游戏 界面 
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本 游戏 使 用 的 图 片 元 素 的 含义 如 下 


目的 地 ”工人 箱子 ”通道 


党 
围墙 子 已 在 


箱 目的 地 


11.2 ”程序 设计 的 思路 


首先 来 确定 一 下 开发 难点 。 对 工人 的 操作 很 简单 ， 就 是 4 个 方向 移动 ， 工 人 移动 ， 箱 
子 也 移动 ， 所 以 对 按键 的 处 理 也 比较 简单 。 当 箱子 到 达 目 的 地 位 置 时 就 会 产生 游戏 过 关 事 
件 ， 需 要 一 个 逻辑 判断 。 仔 细 地 想 一 下 ， 所 有 事件 都 发 生 在 一 张 地 图 中 。 这 张 地 图 包括 了 
箱子 的 初始 化 位 置 、 箱 子 最 终 放置 的 位 置 和 围墙 障碍 等 。 每 一 关 地 图 都 要 更 换 ， 这 些 位 置 
也 要 变 。 所 以 每 关 的 地 图 数据 是 最 关键 的 ， 它 决定 了 每 关 的 不 同 场 景 和 物体 位 置 。 那 么 下 
面 重点 分 析 一 下 地 图 。 

这 里 把 地 图 想象 成 一 个 网 格 ， 每 个 格子 就 是 工人 每 次 移动 的 步 长 ， 也 是 箱子 移动 的 距 
离 ， 这 样 问题 就 简化 多 了 。 首 先 设计 一 个 7x7 的 二 维 列表 myArray， 按 照 这 样 的 框架 来 思 
考 。 对 于 格子 的 x、y 两 个 屏幕 像素 坐标 ， 可 以 由 二 维 列 表 下 标 换算 。 

对 于 每 个 格子 的 状态 值 ， 分 别 用 常量 Wall (0) 代表 墙 、Worker (1) 代表 人 、Box (2) 
代表 箱子 、Passageway (3) 代表 路 、Destination (4) 代表 目的 地 、WorkerInDest (5) 代表 
人 在 目的 地 、RedBox(6) 代表 放 到 目的 地 的 箱子 。 在 文件 中 ， 原 始 地 图 中 格子 的 状态 值 采 
相应 的 整数 形式 存放 。 

在 玩家 通过 键盘 控制 工人 推 箱子 的 过 程 中 ， 需 要 按 游戏 规则 判断 是 否 响应 该 按键 指 
示 。 下 面 分 析 一 下 工人 将 会 遇 到 什么 情况 ， 以 便 归 纳 出 所 有 的 规则 和 对 应 算法 。 为 了 描述 
方便 ， 可 以 假设 工人 的 移动 趋势 方向 为 向 右 ， 其 他 方向 的 原理 是 一 致 的 。P1、P2 分 别 代表 
工人 移动 趋势 方向 前 的 两 个 方 格 。 


@ 前 方 P1 是 通道 

如 果 工 人 前 方 是 通道 ， 工 人 可 以 进 到 P1 方 格 ， 修 改 相 关 位 置 格子 的 状态 值 。 

@ 前 方 P1 是 围墙 或 出 界 

如 果 工 人 前 方 是 围墙 或 出 界 〈 即 阻挡 工人 的 路 线 )， 退 出 规则 判断 ， 布 局 不 做 任何 


@ 前 方 P1 是 目的 地 
如 果 工 人 前 方 是 目的 地 ， 工 人 可 以 进 到 P1 方 格 ， 修 改 相关 位 置 格子 的 状态 值 。 
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@ 前 方 P1 是 箱子 


a 


在 前 面 3 种 情况 中 ， 只 要 根据 前 方 P1 处 的 物体 就 能 判断 出 工人 是 否 可 以 移动 ， 而 在 
第 4 种 情况 中 ， 需 要 判断 箱子 前 方 P2 处 的 物体 才能 判断 出 工人 是 否 可 以 移动 ， 此 时 有 以 
下 可 能 。 

(1) P1 处 为 箱子 ，P2 处 为 墙 或 出 界 : 如 果 工 人 前 方 Pl 处 为 箱子 ，P2 处 为 墙 或 出 界 ， 
退出 规则 判断 ， 布 局 不 做 任何 改变 。 

(2) P1 处 为 箱子 ，P2 处 为 通道 : 如果 工 人 前 方 Pl 处 为 箱子 ，P2 处 为 通道 ， 工 人 可 以 
进 到 了 P1 方 格 ; P2 方 格 状 态 为 箱子 ， 修 改 相关 位 置 格子 的 状态 值 。 

(3) P1 处 为 箱子 ，P2 处 为 目的 地 : 如 果 工 人 前 方 Pl 处 为 箱子 ，P2 处 为 目的 地 ， 工 人 
以 进 到 P1 方 格 ，P2 方 格 状态 为 放置 好 的 箱子 ， 修 改 相关 位 置 格子 的 状态 值 。 

(4) Pl 处 为 放 到 目的 地 的 箱子 ，P2 处 为 通道 : 如 果 工 人 前 方 Pl 处 为 放 到 目的 地 的 箱 
子 ，P2 处 为 通道 ， 工 人 可 以 进 到 P1 方 格 ，P2 方 格 状态 为 箱子 ， 修 改 相关 位 置 格子 的 状 
态 值 。 

(5) Pl 处 为 放 到 目的 地 的 箱子 ，P2 处 为 目的 地 : 如 果 工 人 前 方 Pl 处 为 放 到 目的 地 的 
箱子 ，P2 处 为 目的 地 ， 工 人 可 以 进 到 了 1 方 格 ; P2 方 格 状态 为 放置 好 的 箱子 ， 修 改 相关 位 
置 格子 的 状态 值 。 

综合 前 面 的 分 析 ， 可 以 设计 出 整个 游戏 的 实现 流程 。 


11.3 ”关键 技术 


在 该 游戏 中 设计 “ 重 玩 ”功能 便于 玩家 无 法 通过 时 重 玩 此 关 游戏 ， 这 时 需要 将 地 图 信 
息 恢 复 到 初始 状态 , 所 以 需要 将 7x7 的 二 维 列表 myArray 进行 复制 , 注意 此 时 需要 了 解 “ 列 
表 复 制 一 一 深 复 制 ” 问 题 。 


互 


下 面 举 个 例子 。 

问题 描述 :已 知 一 个 列表 a， 生 成 一 个 新 的 列表 b， 列 表 元 素 是 对 原 列表 的 复制 。 
a=[1,2] 

b=a 


这 种 做 法 其 实 并 未 真正 生成 一 个 新 的 列表 ，b 指向 的 仍然 是 a 所 指向 的 对 象 。 这 样 ， 
如 果 对 a 或 b 的 元 素 进行 修改 ，a、b 列表 的 值 同时 发 生变 化 。 
解决 的 方法 如 下 : 
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SEE 
b=a[:] # 切 片 ， 或 者 使 用 b=copy .copy (a) 


这 样 修改 a 对 b 没 有 影响 ， 修 改 b 对 a 没有 影响 

这 种 方法 只 适用 于 简单 列表 ， 也 就 是 列表 中 的 元 素 都 是 基本 类 型 ， 如 果 列 表 元 素 中 还 
存在 列表 , 这 种 方法 就 不 适用 了 。 原因 就 是 a[:] 这 种 处 理 只 是 将 列表 元 素 的 值 生成 一 个 新 的 
列表 ， 如 果 列 表 元 素 也 是 一 个 列表 ， 例 如 a=[1.[2]]， 那 么 这 种 复制 对 于 元 素 [2] 的 处 理 只 是 
复制 2] 的 引用 ， 并 未 生成 2] 的 一 个 新 的 列表 复制 。 为 了 证 明 这 一 点 ， 测 试 步 又 如 下 : 


>>> = 和 [21 
>>> b=a[:] 
>>> b 
[1, [2] 
>>> a[l] .append (3) 
>>> a 

[1, [2, 3]] 

>>> b 

[1, [2, 3]] 


可 见 , 对 a 的 修改 影响 到 了 b。 如 果 要 解决 这 一 问题 ,可 以 使 用 copy 模块 中 的 deepcopyO 
函数 。 修 改 测试 如 下 : 

>>> import copy 

>>> a=[1, [2]] 

>>> b=copy.deepcopy (a) 

>>> b 

[1， [2]] 

>>> a[1].append(3) 

>>> a 

[1 [2，3]] 


[1, [2]] 


知道 这 一 点 是 非常 重要 的 ， 因 为 在 本 游戏 中 需要 一 个 新 的 二 维 列表 现在 状态 地 图 )， 
并 且 对 这 个 新 的 二 维 列表 进行 操作 ， 同 时 不 想 影响 原来 的 二 维 列表 原始 地 图 )。 


11.4 程序 设计 的 步骤 


@ 设计 游戏 地 图 

整个 游戏 在 7x7 区 域 中 ， 使 用 二 维 列 表 myArray 存储 。 其 中 ， 方 格 状 
态 值 0 代表 墙 ，1 代表 人 ，2 代表 箱子 ，3 代表 路 ，4 代表 目的 地 ，5 代表 
人 在 目的 地 ，6 代表 放 到 目的 地 的 箱子 。 例 如 图 11-1 所 示 的 推 箱子 游戏 界 
面 的 对 应 数据 如 下 : 
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方 格 状态 值 采 上 
# 原 始 地 图 


myArrayl 存储 注意 按 列 
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为 了 明确 表示 方 格 状态 
用 imgs 列表 存储 图 像 ， 而 且 按 照 图 形 代号 的 顺序 储存 图 像 。 


Wall=0 
Worker=1 

Box=2 
Passageway=3 
Destination=4 
WorkerInDest=5 
RedBox=6 

# 原 始 地 图 


瑟 


= 自 


忆 、y 


这 里 定义 变量 名 (Python 没有 枚 举 类 型 ) 来 表示 ， 并 使 


myArrayl=[[0,3;1,4;3,3,3], 
O03gran2r Sr ar 
LonO Sm 
ISr3n2a ronal 
上 
10D7ar3rS dl 
【0970w00NO7OII 
imgs=[PhotoImage (file='bmp\\Wall .gif"'), 
PhotoImage (file='bmp\\Worker.gif'), 


PhotoImage (file='bmp\\Box.gif"), 


PhotoImage (file='bmp\\Passageway.gif"'), 


PhotoImage (file='bmp\\Destination.gif"), 


PhotoImage (file='bmp\\WorkerIinDest .gif"), 
PhotoImage (file='bmp\\RedBox.gif")] 
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P hon 项 目 案例 开发 
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人 @ 绘制 整个 游戏 区 域 图 形 


绘制 整个 游戏 区 域 图 形 就 是 按照 地 图 myArray 储存 图 形 代号 ， 从 imgs 列表 获取 对 应 


图 像 ， 显 示 到 Canvas 上 。 全 局 变量 x、y 代表 工人 当前 位 置 ， 即 (x.y)， 
时 如 果 是 1 (Worker 值 为 1)， 则 记录 当前 位 置 。 


def drawGameImage () : 


从 地 图 myArray 读 


;人 


global x,y 
for i in range(0,7) : #0~6 
for j in range(0,7) : #0~6 
if myArray[i][j]==Worker : 
x=i # 工 人 当前 位 置 (x， 
ya 
print ("工人 当前 位 置 :", x, y) 
imgl=imgs [myArray [i] [j]] # 从 imgs 列表 获取 对 应 图 像 
cv.create image ( (i*32+20,j*32+20),image=imgl) # 显 示 到 Canvas 上 
cv.pack() 
全 按键 事件 处 理 


在 游戏 中 对 于 用 户 按键 的 操作 采用 Canvas 对 象 的 KeyPress 按键 事件 处 理 。KeyPress 


按键 处 理 函 数 callbackO 根 据 用 户 的 按键 消息 计算 出 工人 移动 趋势 方向 


前 两 个 方 格 的 位 置 


坐标 (xl, y1)、 (x2, y2), 将 所 有 位 置 作 为 参数 调用 MoveTo(xl, yl, x2, y2) 判 断 并 做 地 图 更 新 。 


如 果 用 户 按 空 格 键 ， 则 恢复 游戏 界面 到 原始 地 图 状态 ， 实 现 “ 重 玩 ” 芭 
def callback (event) : # 按 键 处 理 
# (xz1，Y1) 、(x2，Y2) 分 别 代表 工人 移动 趋势 方向 前 的 两 个 方 格 
global x,y,myArray 
print (" 按 下 键 : "” ) 
print (" 按 下 键 : "，event .char) 
KeyCode=event .keysym 


# 工 人 当前 位 置 (x, y) 
if KeyCode=="Up": # 分 析 按 键 消息 
# 向 上 

Xl1=X; 

Yl=y-13 

X2=X; 

Y2=Y-227 


# 将 所 有 位 置 输入 以 判断 并 做 地 图 更 新 
MoveTo (x1, yl, x2, y2); 
# 向 下 
elif KeyCode=="Down": 
Xl1=x; 
yl=y+1; 
X2=x; 
y2=y+2; 
MoveTo (x1, yl, x2, y2); 
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# 向 左 
elif KeyCode=="Left": 
X1=X-17 
Ylsys 
X2=X-27 
Y2=Y7 
MoveTo (x1, yl, x2, y2); 
# 向 右 
elif KeyCode=="Right": 
X1=X+17 
yl=y; 
X2=X+27 
Y2=Y7 
MoveTo (x1, yl, x2, y2); 
elif KeyCode=="Space": # 空 格 键 
print (" 按 下 键 : "，event .char) 
myRrray=copy.deepcopy (myRrray1) “恢复 原始 地 图 
drawGameImage () 


IsInGameArea(row, coD) 判 断 是 否 在 游戏 区 域 中 。 


def IsInGameRArea (row, col) 
return (row>=0 and row<7 and col>=0 and col<7) 


MoveTo(x1,y1,x2,y2) 方 法 是 最 复杂 的 部 分 ， 实 现 前 面 分 析 的 所 有 规则 和 对 应 算法 。 


def MoveTo(xl, yl, x2, y2) 


global x,y 

Pl=None #P1、P2 是 移动 趋势 方向 前 的 两 个 格子 
P2=None 

if IsInGameArea(xl, yl) : # 判 断 是 否 在 游戏 区 域 


Pl=myArray [x1] [yl1]; 

if IsInGameArea (x2, y2) 
P2=myArray [x2] [y2]; 

if Pl==Passageway : #P1 处 为 通道 
MoveMan (x, y); 
x=x1; y=yl1; 
myArray[x1] [yl1]=Worker; 

if Pl==Destination : #P1 处 为 目的 地 
MoveMan (x, y); 
x=xX1; y=y1; 
myArray[x1] [yl1]=WorkerInDest; 

if Pl==Wall or not IsInGameArea (xl, y1) 
#P1 处 为 墙 或 出 界 
return; 

if Pl==Box : #P1 处 为 箱子 
if P2==Wall or not IsInGameRrea (X1，Y1) or P2==Box:#P2 处 为 墙 或 出 界 
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return; 
# 以 下 P1 处 为 箱子 
#P1 处 为 箱子 ，P2 处 为 通道 
if Pl==Box and P2==Passageway : 
MoveMan (x, y); 
X=X17 y=yl; 
myArray[x2] [y2]=Box; 
myArray[x1] [yl1]=Worker; 
if Pl==Box and P2==Destination : 
MoveMan (x, y); 
X=X17 y=yl1; 
myArray[x2] [y2]=RedBox; 
myArray[x1] [yl1]=Worker; 
#P1 处 为 放 到 目的 地 的 箱子 ，P2 处 为 通道 
if Pl==RedBox and P2==Passageway : 
MoveMan (x, y); 
X=X17 y=yl1; 
myArray[x2] [y2]=Box; 
myArray[x1] [yl1]=WorkerIinDest; 
#P1 处 为 放 到 目的 地 的 箱子 ，P2 处 为 目的 地 
if Pl==RedBox and P2==Destination : 
MoveMan (x, y); 
x=x1; y=yl; 
myArray[x2] [y2]=RedBox; 
myArray[x1] [yl1]=WorkerIinDest; 
drawGameImage () 
# 这 里 要 验证 是 否 过 关 
if IsFinish() 
showinfo (title=" 提 示 ",message=" 恭 喜 你 顺利 过 关 " ) 
prune 


MoveMan(x,y) 移 走 位 置 为 (x, y) 的 工人 ， 修 改 格 子 状态 值 。 


def MoveMan (x, y) 


if myArray[x] [y] ==Worker : 
myArray[x] [y]=Passageway; 

elif myArray[x] [y]==WorkerIinDest : 
myArray[x] [y]=Destination; 


IsFinish() 验 证 是 否 过 关 ， 只 要 方 格 状 态 存 在 目的 地 (Destination) 或 人 在 目的 地 上 
(WorkerInDest)， 则 表明 有 没 放 好 的 箱子 ， 游 戏 还 未 成 功 ， 否 则 成 功 。 
def IsFinish() : # 验 证 是 否 过 关 
bFinish=True; 


for i in range(0,7) : #0 一 6 
Eor 3 in range(07) : #0~6 


| 222 


第 11 章 益 智 游戏 一 推 箱子 游戏 1 1 


if (myArray[il] [j]==Destination 
or myRrray[i]l [j]==WorkerInDest) 
bFinish=False; 


return bFinish; 


@ 主 程序 


Foot=TKk() 

root -title (" 推 箱子 一 夏 敏捷 ") 

cv=Canvas (root, bg='green', width=226, height=226) 
myArray=copy .deepcopy (myArray1) 


drawGameImage () 

cv.bind("<KeyPress>", callback) 
cv.pack() 

cv.focus set () # 将 焦点 设置 到 cv 上 


root .mainloop() 


至 此 完成 推 箱子 游戏 。 读 者 可 以 考虑 一 下 多 关 推 箱子 游戏 如 何 开发 ， 例 如 把 10 关 游 戏 的 
地 图 信息 存储 在 map.txt 文件 里 ， 需 要 时 从 文件 中 读 取 下 一 关 数 据 即 可 。 
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12.1 麻将 游戏 介绍 


麻将 起 源 于 中 国 ， 它 集 益 智 性 、 趣 味 性 、 博 弈 性 于 一 体 ， 是 中 国 传统 
文化 的 一 个 重要 组 成 部 分 , 不 同 地 区 的 游戏 规则 稍 有 不 同 。 麻 将 牌 每 副 136 张 , 主要 有 “ 饼 
( 文 钱 )”“ 条 ( 索 子 )”“ 万 (万 贯 )” 等 。 与 其 他 牌 形式 相 比 ， 麻 将 的 玩法 最 为 复杂 、 有 趣 ， 
它 的 基本 打 法 简单 ， 因 此 成 为 中 国 历史 上 最 能 吸引 人 的 博 戏 形式 之 一 。 


12.1.1 麻将 术语 


麻将 术语 是 “ 吃 ”“ 碰 ”“ 杠 ”“ 听 ”。 

。 吃 ; 如 果 任 何 一 位 选手 手中 的 牌 的 两 张 加 上 上 家 选手 刚 打 下 的 一 张 牌 恰好 成 顺 子 ， 
他 就 可 吃 牌 。 

。 碰 : 如 果 某 方 打 出 一 张 牌 ,而 自己 手中 有 两 张 以 上 与 该 牌 相同 的 牌 , 可 以 选择 碰 牌 。 
碰 牌 后 ， 取 得 对 方 打 出 的 这 张 牌 ， 加 上 自己 提供 的 两 张 相同 的 牌 成 为 刻 子 ， 倒 下 这 
个 刻 子 ， 不 能 再 出 。 然 后 再 出 一 张 牌 。“ 碰 ” 比 “ 吃 ”优先 ， 如 果 要 碰 的 牌 刚 好 是 
出 牌 方 下 家 要 吃 的 牌 ， 则 吃 牌 失败 ， 碰 牌 成 功 。 

。 杠 : 其 他 人 打出 一 张 牌 ， 自 己 手 中 有 3 张 相 同 的 牌 ， 即 可 杠 牌 。 杠 牌 分 明 杠 和 暗 杠 
两 种 。 

。 听 : 当 将 手中 的 牌 都 凑 成 了 有 用 的 牌 ， 只 需 再 加 上 第 14 张 便 可 和 牌 ， 则 玩家 就 可 
以 进入 听 牌 的 阶段 。 


12.1.2 ”有 牌 数 


麻将 共 136 张 牌 。 
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(1) 万 牌 。 从 一 万 至 九 万 ， 各 4 张 ， 共 36 张 。 

(2) 饼 牌 ， 从 一 饼 至 九 饼 ， 各 4 张 ， 共 36 张 。 

(3) 条 牌 : 从 一 条 至 九条 ， 各 4 张 ， 共 36 张 。 

(4) 风 牌 : 东 、 南 、 西 、 北 ， 各 4 张 ， 共 16 张 。 

(5) 字 牌 : 中 、 发 、 白 ， 各 4 张 ， 共 12 张 。 

本 章 设计 的 是 两 人 麻将 程序 ， 可 以 实现 玩家 (人 ) 和 计算 机 对 下 。 游 戏 有 吃 、 碰 功能 ， 
和 牌 〈 即 胡 牌 ) 判断 。 为 了 降低 程序 的 复杂 度 ， 游 戏 没有 设计 杠 的 功能 。 同 时 对 计算 机 出 
牌 进 行 了 智能 设计 ， 游 戏 中 上 方 为 计算 机 的 牌 ， 下 方 为 玩家 的 牌 ， 有 “ 吃 牌 ”>“ 碰 牌 ”“ 和 
牌 ”“ 摸 牌 ” 和 “出 牌 ”按钮 供 玩家 选择 ， 游 戏 初始 界面 如 图 12-1 所 示 。 
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图 12-1 两 人 麻将 游戏 运行 的 初始 界面 


12.2 两 人 麻将 游戏 设计 的 思路 
12.2.1 素材 图 片 


麻将 牌 共 136 张 。 万 子 牌 从 一 万 至 九 万 , 饼 子 牌 从 一 饼 至 九 饼 , 条 子 牌 从 一 条 至 九条 ， 
字 牌 有 东 、 南 、 西 、 北 和 中 、 发 、 白 。 在 设计 时 麻将 牌 图 片 文件 按 以 下 规律 编号 :一 饼 至 
九 饼 为 11jpg 一 19jpg， 一 条 至 九条 为 21jpg 一 29jpg， 一 万 至 九 万 为 31.jpg~~39.jpg， 字 牌 
为 41.jpg 一 47.jpg， 如 图 12-2 所 示 。 
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0 3% 


天 中 于 


[三 三 四 五 六 七 ~ 九 
放下 让 


图 12-2 素材 图 片 


12.2.2 ”游戏 的 逻辑 实现 


玩家 自己 出 过 牌 ，MyTur=False， 则 轮 到 计算 机 智能 出 牌 ， 计 算 机 出 
完 牌 则 MyTum= True， 同 时 “ 摸 牌 ” 按 钮 有 效 ， 这 样 又 轮 到 玩家 出 牌 。 


MyTurn=True # 轮 到 玩家 出 牌 
Get btn["state"]=NORMAL # 摸 牌 有 效 


在 游戏 过 程 中 ， playersCard 列表 (数组 ) 记录 两 个 牌 手 的 牌 ， 其 中 playersCard[0] 记 
录 玩 家 自己 (0 号 牌 手 ) 的 牌 ，playersCard[1] 记 录 计 算 机 (1 号 牌 手 ) 的 牌 。 同 理 ， 
playersOutCard 数组 记录 两 个 牌 手 出 过 的 牌 。 所 有 的 牌 存 入 m_aCards 列表 (数组 )， 同 时 
为 了 便于 知道 该 发 哪 张 牌 ， 这 里 k 记录 已 发 牌 的 个 数 ， 从 而 知道 要 摸 的 牌 是 m_aCards[k]。 


12.2.3” 碰 / 吃 牌 的 判断 


在 游戏 过 程 中 玩家 自己 可 以 碰 牌 和 吃 牌 ， 所 以 需要 判断 计算 机 〈1 号 牌 手 ) 刚 出 的 牌 
玩家 是 否 可 以 磁 、 吃 ， 如 果 能 够 碰 、 吃 ， 则 “ 碰 牌 ”“ 吃 牌 ” 和 “ 摸 牌 ”按钮 有 效 。 

人 否 碰 牌 的 判断 比较 简单 ， 由 于 每 张 牌 对 应 文件 的 主 文件 名 是 imageID， 所 以 仅仅 统 
计 相 同 imageID 的 牌 即 可 知道 是 否 有 两 张 以 上 ， 如 果 有 则 可 以 碰 牌 。 

# 是 否 可 以 碰 牌 


def canPeng(a,card):#(List a,Card card) 
n=0 


for i in range(0,1len(a)): 
c=a[i] 
if(c.imageID==card.imageID) : 
n+=1 


if n>=2: 


| 226 


第 12 章 娱乐 游戏 一 一 两 人 麻将 游戏 1 2 


return True 
print ("不 能 碰 牌 1!1", card.imageID) 
return False 
能 否 吃 牌 的 判断 也 比较 简单 ， 由 于 牌 手 手 里 的 牌 (a 列表 ) 已 经 排 过 序 了 ， 只 要 判断 
以 下 3 种 情况 : 


]** 


米 ] 水 
玉米 ] 
1 代表 对 方刚 出 的 牌 ， 如 果 符 合 这 3 种 情况 则 可 以 吃 牌 。 


# 是 否 可 以 吃 牌 
def canChi (a,card): 
n=0 
if card.m nType==4: # 字 牌 不 用 判断 吃 
return False 
for i in range(0,1en(a)—1): #1** 
cl=a[i] 
c2=a[i+l] 
if(cl.m nNum==card.m nNum+l and cl.m nType==card.m nType 
and c2.m nNum==card.m nNum+2 and c2.m nType==card.m nType): 
return True 
for i in range(0,1len(a)—1): #*1* 
cl=a[i] 
c2=a[i+l] 
if(cl.m nNum==card.m nNum-1 and cl.m nType==card.m nType 
and c2.m nNum==card.m nNum+l1 and c2.m nType==card.m nType): 
return True 
for i in range(0,1en(a)—1): #**] 
cl=a[li] 
c2=a[i+1] 
if(cl.m nNum==card.m nNum-2 and cl.m nType==card.m nType 
and c2.m nNum==card.m nNum-1 and c2.m nType==card.m nType): 
return True 
print ("不 能 吃 牌 !!1", card.imageID) 
return False 


12.2.4 ”和 上 牌 算法 


@ 数据 结构 的 定义 
麻将 由 “万 ”“ 饼 ”( 简 ) “条 ”( 索 )“ 字 ”4 类 牌 组 成 ， 其 中 “万 ”又 。 ”视频 讲解 
分 为 “一 万 ” ~“ 九 万 ” 各 4 张 ， 共 36 张 ,“ 饼 ”和 “条 ”类 似 ,“ 字 ”又 分 为 “ 东 ”“ 南 ” 
西 "“ 北 ”“ 中 ”“ 发 "“ 白 ”各 4 张 ， 共 28 张 。 


人 
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这 里 定义 了 一 个 4x10 的 二 维 列 表 (相当 于 其 他 语言 中 的 4x10 的 二 维 数组 
int allPai [4][10])， 它 记录 了 牌 手 手中 的 牌 的 全 部 信息 ， 行 号 记录 类 别 信息 ， 第 0~3 行 分 
别 代 表 “ 饼 ”“ 条 ”“ 万 ”“ 字 ”。 

以 第 2 行为 例 ， 它 的 第 0 列 记录 了 牌 中 所 有 “万 ”的 总 数 ， 第 1 一 9 列 分 别 对 应 “一 
万 ”~“ 九 万 ”的 个 数 ,“ 饼 ”和 “条 ”类 似 。“ 字 ”不 同 的 是 第 1 一 7 列 对 应 的 是 “中 ”“ 发 ” 
“ 白 "“ 东 ”“ 南 ”“ 西 "“ 北 ”的 个 数 ， 第 8、9 列 恒 为 0。 


根据 麻将 的 规则 ， 数 组 中 牌 的 总 数 一 定 为 3n+2， 其 中 n=0,1,2,3,4。 例 如 有 以 下 数组 : 
allPai=[ 

[6rTel Dr0731。 4 名 6 个 钳 牌 2 “一 便 ”“ 二 和 借 ”三 村 ”和 13 个 “五 僻 ” 

[eno 2 on # 条 ，5 个 条 牌 ， 两 个 “二 条 ”和 3 个 “四 条 ” 

[0]， # 万 ， 无 万 牌 

[ES # 字 ，3 个 字 牌 “发 ” 


] 

它 表示 牌 手 手 中 的 牌 为 “一 饼 ”“ 二 饼 ”“ 三 饼 ”“ 五 饼 ”“ 五 饼 ”“ 五 饼 ”，“ 二 条 ”“ 二 
条 ”“ 四 条 ”“ 四 条 ”“ 四 条 ”，“ 发 "“ 发 " “发”， 共 6 张 “ 饼 5 张 “ 条 ”0 张 “ 万 ”3 
张 “ 字 ”。 

四 算法 设计 

由 于 “七 对 子 ”“ 十 三 么 ”这 种 特殊 牌 型 的 和 上牌 依据 不 是 牌 的 相互 组 合 ， 而 且 规 则 也 
不 尽 相 同 ， 这 里 将 这 类 情况 排除 在 外 。 

尽管 能 构成 和 牌 的 形式 千变万化 ， 但 稍 加 分 析 可 以 看 出 它 离 不 开 一 个 模型 : 可 以 分 解 
为 “三 、 三 …… 三 、 二 ”的 形式 (总 牌 数 为 3n+2 张 )， 其 中 的 “三 ”表示 的 是 “ 顺 ” 或 “ 刻 ” 
(连续 3 张 牌 叫 作 “ 顺 ”， 例 如 “三 饼 ”“ 四 饼 ”“ 五 饼 ”，“ 字 ” 牌 不 存在 “ 顺 ”，3 张 同样 的 
牌 叫 作 “ 刻 ” 例如 “三 饼 ”“ 三 饼 ”“ 三 饼 ”)， 其 中 的 “二 ”表示 的 是 “将 ”( 两 张 相同 的 
牌 可 作为 “将 ” 例如 “三 饼 ”“ 三 饼 ”)。 

在 代码 实现 中 ， 首 先 判 断 牌 手 手中 的 牌 是 否 符合 这 个 模型 ， 这 样 就 用 极 少 的 代价 排除 
了 大 多 数 情 况 ， 具 体 方法 是 用 3 除 allPai [ij[0] (存储 每 种 牌 型 数量 )， 其 中 i=0,. 1, 2,3， 只 
有 在 余数 有 且 仅 有 一 个 为 2， 其 余 全 为 0 的 情况 下 才 可 能 构成 和 牌 。 

对 于 余数 为 0 的 牌 ， 它 一 定 要 能 分 解 成 一 个 “ 刻 ” 和 “ 顺 ” 的 组 合 ， 这 是 一 个 递归 的 
过 程 ， 由 函数 bool Analyze(list,boo]) 处 理 。 

对 于 余数 为 2 的 牌 ， 一 定 要 能 分 解 成 一 对 “将 ”与 “ 刻 ” 和 “ 顺 ” 的 组 合 ， 由 于 任何 
数目 大 于 等 于 2 的 牌 均 有 作为 “将 ”的 可 能 ， 需 要 对 每 张 牌 进行 轮 询 ， 如 果 它 的 数目 大 于 
等 于 2， 去 掉 这 对 “将 ”后 再 分 析 它 能 否 分 解 为 “ 刻 ” 和 “ 顺 ” 的 组 合 ， 这 个 过 程 的 开销 
相对 较 大 ， 放 在 了 程序 的 最 后 进行 处 理 。 在 递归 和 轮 询 过 程 中 ， 尽 管 每 次 去 掉 了 某 些 牌 ， 
但 最 终 都 会 再 次 将 这 些 牌 加 上 ， 使 得 数组 中 的 数据 保持 不 变 。 

最 后 分 析 递 归 函 数 bool Analyze(list,bool), 列表 (数组) 参数 表示 一 类 牌 , 即 “ 万 ”“ 饼 ” 
“条 ”“ 字 ”之 一 ， 布 尔 参数 指出 列表 〈 数 组 ) 参数 是 否 为 “ 字 ” 牌 ， 这 是 因为 “ 字 ” 牌 只 
能 “ 刻 ” 不 能 “ 顺 ”。 对 于 列表 (数组) 中 的 第 1 张 牌 ， 如 果 要 构成 和 牌 ， 它 就 必须 与 其 他 
牌 构成 “ 顺 ” 或 “ 刻 ” 
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如 果 数 目 大 于 等 于 3, 那么 它们 一 定 是 以 “ 刻 ” 的 形式 组 合 。 例如 当前 有 3 张 “ 五 万 ”， 
如 果 它 们 不 构成 “ 刻 ” 则 必须 有 3 张 “ 六 万 ”、3 张 “ 七 万 ”与 其 构成 3 个 “ 顺 ”( 注 意 此 
时 “五 万 ”是 数组 中 的 第 1 张 牌 ，， 否 则 就 会 剩 下 “五 万 ”不 能 组 合 ， 而 此 时 的 3 个 “ 顺 ” 
实际 上 也 是 3 个 “ 刻 ”。 去 掉 这 3 张 牌 ， 递 归 调 用 bool Analyze(list,bool) 函 数 ， 如 果 成 功 则 
和 牌 。 当 该 牌 不 是 字 牌 且 其 下 两 张 牌 均 存在 时 它 还 可 以 构成 “ 顺 ”， 去 掉 这 3 张 牌 , 递归 调 
bool Analyze (lisbbool) 函 数 ， 如 果 成 功 则 和 牌 。 如 果 此 时 还 不 能 构成 和 牌 ， 说 明 该 牌 不 
能 与 其 他 牌 顺利 组 合 ， 传 入 的 参数 不 能 分 解 为 “ 顺 ” 和 “ 刻 ” 的 组 合 ， 不 可 以 构成 和 牌 。 


这 里 根据 上 述 思 想 单独 设计 一 个 类 文件 (huMain py) 验证 和 牌 算法 ， 代 码 如 下 : 


class huMain(): 
asf Nanie (se1ft 光 # 构 造 函 数 
# 定 义 牌 手 手中 的 牌 int allPair4] [10] 
self.allpai=[[6,1,4,1,0,0,0,0,0,0], # 包 


[SEE O00 O00 Onol # 条 
LOO OOO OO OO # 万 
[5,2,3,0,0,0,0,0,0,0]] # 字 


if self.Win(self.allPai): 
print ("Hu!\n") 
SLS 
print ("Not Hu!\n") 
# 判 断 是 否 和 牌 的 函数 
def Win(self,allPai): 
jiangPos=0 #“ 将 ”的 位 置 
jiangExisted=False 
# 是 否 满足 3, 3, 3, 3, 2 模型 
for i in range(0,4) : 


#yushu # 余 数 
yushu=allPai [i] [0]%3 


if yushu==l1 : 
return False # 不 满足 3，3，3，3，2 模型 
if yushu==2 : 
if jiangExisted==True: 
return False # 不 满足 3，3，3，3，2 模型 
jiangPos=i #“ 将 ”在 哪 行 
jiangExisted=True 


# 不 含 “ 将 ”处 理 
for i in range(0,4): 
if i!=jiangPos : 
if not self.Analyze(allPai [i],i==3): 


return False 


# 该 类 牌 中 要 包含 “将 ” 因为 要 对 “将 ”进行 轮 询 ， 效 率 较 低 ， 放 在 最 后 
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Success=False # 指 出 除 掉 “ 将 ”后 能 否 通过 
for j in range(1,10) : 提 对 列 进行 操作 ， 用 j 表示 
if(allPai[]jiangPos] [j]>=2): 
# 除 去 这 两 张 将 牌 


allPai [jiangPos] [j] -=2 
allPai [jiangPos] [0] -=2 
if self.Analyze (allPai[jiangPos],jiangPos==3) 
success=True 
# 还 原 这 两 张 将 牌 
allPai [jiangPos] [j]+=2 
allPai [jiangPos] [0]+=2 
if success==True : 
break 
return success 


# 分 解 成 “ 刻 ”“ 顺 ”组 合 
def Analyze (self,aKindPai,ziPai): #(int aKindPai[],Boolean ziPai) 

if aKindPai[0]== 
return True 

# 寻 找 第 1 张 牌 

for j in range(1,10) : 
if aKindPai[j]!=0: 

break 

if aKindPai[j]>=3: # 作 为 刻 牌 
# 除 去 这 3 张 刻 牌 
aKindPai[j]-=3 
aKindPai [0] -=3 
result=self.Analyze (aKindPai, ziPai) 
# 还 原 这 3 张 刻 牌 
aKindPai [j]+=3 
aKindPai [0]+=3 
return result 

# 作 为 顺 牌 

if(not zipPai)and(j<8) and (aKindPai[j+1]>0) and (aKindPai[j+2]>0): 
# 除 去 这 3 张 顺 牌 
aKindPai[j]-=1 
aKindPai[j+1] -=1 
aKindPai [j+2] -=1 
aKindPai[0]-=3 
result=self.Analyze (aKindPai, ziPai) 
# 还 原 这 3 张 顺 牌 
aKindPai[j]+=1 
aKindPai [j+1]+=1 
aKindPai [j+2]+=1 
aKindPai [0]+=3 


return result 


return False 
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12.2.5 ”实现 计算 机 智能 出 牌 


在 游戏 中 有 两 个 牌 手 ， 一 个 是 


是 玩家 自己 (0 号 牌 手 )， 


果 计 算 机 只 能 随机 出 牌 ， 则 游戏 的 可 玩 性 较 差 ， 所 以 智能 则 
为 了 判断 出 牌 ， 需 要 首先 计算 牌 手 手中 各 种 牌 型 的 数量 。 二 维 列表 paiArray 存储 了 和 

牌 算法 的 数据 结构 ， ec re ， 行 号 记录 类 别 信息 ， 第 0~3 行 分 别 代 
表 “ 饼 ”“ 索 ”“ 万 ”“ 字 ”。 本 游戏 这 里 给 出 一 个 智能 出 牌 的 算法 : 


假设 cards 为 手中 所 有 的 牌 。 


一 个 是 计算 机 (1 号 牌 手 )。 如 


8 牌 是 一 个 设计 重点 。 


(1) 判断 字 牌 的 单 张 ， 即 paiArray 行 号 为 3 的 元 素 是 否 为 1， 有 则 找到 ， 返 回 在 cards 


的 索引 号 


(2) 判断 顺 子 、 刻 子 (3 张 相 同 的 )， 有 则 从 paiArray 中 消去 ， 即 不 需要 考虑 这 些 牌 。 
(3) 判断 单 张 非 字 牌 〈 饼 、 条 、 万 )， 有 则 找到 ， 返 回 
(4) 判断 两 张 牌 〈 饼 、 条 、 万 ， 包 括 字 牌 )， 有 则 找到 〈 即 拆 双 牌 )， 返 回 在 cards 中 


的 索引 号 。 


在 cards 中 的 索引 号 。 


(5) 如 果 以 上 情况 均 没 出 现 ， 则 随机 选 出 1 张 牌 ， 当 然 此 种 情况 一 般 不 会 出 现 。 
# 计 算 机 智能 出 牌 v1.0， 计 算出 牌 的 索引 号 


def ComputerCard (cards) : 


# 计 算 牌 手 手中 各 种 牌 型 的 数量 

paiArray=[[0,0,0,0,0,0,0,0,0,0], 
[DOORBAROR On or 
IorQrort Oo onl 
lO0Qa0norQr OOnor di 


for i in range(0,14): 
card=cards [i] 
if(card.imageID>10 
paiArray[0] 
paiArray[0] 
if(card.imageID>20 
paiArray[1] 
paiArray[1] 
if(card.imageID>30 
paiArray[2] 
paiArray[2] 
if(card.imageID>40 
paiArray[3] 


paiArray[3] 
print (paiArray) 


# 计 算 机 智能 选 牌 


and card.imageID<20): 


+=1 
ard.imageID-10]+=1 


Le 


+=1 


站 


ard.imageID-20]+=1 


= 
ard.imageID-30]+=1 


Ss 


= 


+=1 
card.imageID-40]+=1 


# (1) 判断 字 牌 的 单 张 ， 有 则 找到 


nd card.imageID<30): 


nd card.imageID<40): 


nd card.imageID<50): 


# 饼 
# 条 
# 万 


# 字 
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for j in range(1,10): 
if (paiArray[3] []==1) : 
# 获 取 在 手中 的 牌 的 位 置 下 标 
k=ComputerSselectCard (cards, 3+1,j) 
return K 
#〈2) 判断 顺 子 、 刻 子 (3 张 相同 的 》 
for i in range(0,3): 
for j in range(1,10): 
if (paiArray[i] [j]>=3) : # 刻 子 
paiArray[i] [j]-=3 
if(j<=7 and paiArray[i] [j]>=1 and paiArray[i][j+1]>=1 
and paiArray[i][j+2]>=1): # 顺 子 
paiArray[i][j]-=1 
paiArray[i] [j+1]-=1 
paiArray[i] [j+2]-=1 
# (3) 判断 单 张 非 字 牌 〈 饼 、 条 、 万 )， 有 则 找到 
for i in range(0,3) : 
for j in range(1,10) : 
if (paiArray[i] [j]==1): 
# 获 取 在 手中 的 牌 的 位 置 下 标 
k=ComputerSelectCard (cards, i+1,j) 
return Kk 
# (4) 判断 两 张 牌 ( 饼 、 条 、 万 ， 包 括 字 牌 )， 有 则 找到 ， 拆 双 牌 
for i in range(3,-1): 
for j in range(1,10) : 
if (paiArray[i] [j]==2): 
# 获 取 在 手中 的 牌 的 位 置 下 标 


k=ComputerSelectCard (cards, i+1,j) 


return K 
#5) 如 果 以 上 情况 均 没 出 现 ， 则 随机 选 出 1 张 牌 
k=random. randint (0, 13) # 随 机 选 出 1 张 牌 


return K 
# 根 据 牌 (花色 nType， 点 数 nNum) 找 在 a 数组 中 的 索引 位 置 
def ComputerSselectCard(a, nType,nNum): 
for i in range(0,1len(a)): 
card=a[i] 
if(card.m nType==nType and card.m nNum==nNum): 


return i 
reburn =1 
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12.3 ”关键 技术 


12.3.1 声音 的 播放 


winsound 模块 可 以 访问 由 Windows 平台 提供 的 基本 的 声音 播放 设备 , 它 包 含 数 个 声音 
播放 函数 和 常量 。 

@ Beep(frequency, duration) 函数 

计算 机 蜂 鸣 器 。 其 中 ，frequency 参数 指定 声音 的 频率 ， 单 位 为 赫兹 ， 并 且 必 须 在 37 一 
32767 的 范围 之 中 ; duration 参数 指定 声音 应 该 持续 的 毫秒 数 。 

@ PlaySound(sound, flags) 函 数 

从 Windows 平台 API 中 调用 PlaySound0) 函 数 。 其 中 , sound 参数 必须 是 一 个 由 文件 名 、 
音频 数据 形成 的 字符 串 ， 或 为 None。 它 的 解释 依赖 于 flags 的 值 ， 该 值 可 以 是 一 个 位 方式 
或 下 面 变量 的 组 合 。 
SND_FILENAME: sound 参数 是 一 个 WAV 文件 的 文件 名 。 
SND_ LOOP: 重复 地 播放 声音 。 
SND_MEMORY: 提供 给 PlaySound() 的 sound 参数 是 一 个 WAV 文件 的 内 存 映像 形 
成 的 字符 串 。 
SND_PURGE: 停止 播放 所 有 指定 声音 的 实例 。 
SND_ASYNC: 立即 返回 ， 人 允许 声音 异步 播放 。 
SND_NOSTOP: 不 中 断 当前 播放 的 声音 。 
MB_ICONASTERISK: 播放 SystemDefault 声音 。 
MB _ICONEXCLAMATION: 播放 SystemExclamation 声音 。 
例如 播放 八 柄 .warv 声音 文件 的 代码 如 下 : 
import winsound 
winsound.PlaySound ("res\\sound\\ 八 柄 .wav"，winsound. SND_FILENAME) 


12.3.2 ”返回 对 应 位 置 的 组 件 


在 Python Tkinter 中 鼠标 单 击 某 组 件 ， 如 何 得 到 对 应 位 置 的 组 件 呢 ? 

实际 上 ， 当 鼠标 单 击 ， 参 数 event 的 eventx 和 eventy 可 以 获取 鼠标 坐标 的 时 候 ， 
event.widget 返回 的 就 是 事件 发 生 时 所 在 的 组 件 ， 也 就 是 被 用 户 单 击 的 组 件 。 

例如 当 用 户 选 麻将 牌 时 ， 系 统 自动 调用 鼠标 按 下 事件 函数 ， 其 中 将 被 单 击 的 麻将 牌 上 
移 20 像素 。 如 果 此 麻将 牌 已 被 选 过 ， 则 下 移 20 像素 恢复 到 原来 的 正常 位 置 。 

def btn MouseDown (event) : “ 间 鼠 标 单 击 按 下 事件 函数 


# 找 到 相应 的 麻将 牌 对 象 
card=event .widget #event .widget 获取 触发 事件 的 对 象 
card.y-=20 # 上 移 20 像素 


card.place (x=event .widget .x,y=event .widget .y) 
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从 入 门 到 实战 一 一 看 虫 、 游 戏 和 机 器 学 习 


if(m LastCard==None) : 坦 未 选 过 的 牌 
m LastCard=card 
PlayerSelectCard=card 
else: # 已 经 选 过 的 牌 
m LastCard.MoveTo (m LastCard.getX(),m LastCard.getY ()+20)#F 下 移 20 像素 
m LastCard=card 
PlayerSelectCard=card 


12.3.3 ”对 保存 麻将 牌 的 列表 排序 


Python 语言 中 的 列表 排序 方法 有 3 个 ， 即 reverse0 〈 反 转 /倒序 排序 )、sort0《〈 正 序 排 
序 )、sorted0《〈 获 取 排 序 后 的 列表 )， 后 两 种 方法 还 可 以 加 入 条 件 参数 进行 排序 。 

@@ reverse() 方 法 

将 列表 中 的 元 素 倒序 ， 把 原 列表 中 的 元 素 顺序 从 右 至 左 重新 存放 。 例 如 下 面 这 样 : 

> x A 

>>> x.reverse!() 

> # 结 果 是 [4，3,2, 5, 1] 

四 sort0 方 法 

此 方法 对 列表 内 容 进 行 正 向 排序 ， 排 序 后 的 新 列表 会 覆盖 原 列 表 (ID 不 变 )， 是 就 地 
排序 ， 以 节约 空间 。 也 就 是 说 ，sort() 排 序 方法 是 直接 修改 原 列表 。 

D3 ol 6 3 A 

>>> a.sort() 

b>>| #4 结果 是 [1 2 3 41 5 6; 71 

@ sorted0 方 法 

该 方法 既 可 以 保留 原 列表 ， 又 能 得 到 已 经 排 好 序 的 列表 ， 其 操作 方法 如 下 : 

| 

>>> b=sorted (a) 


> >| 二 纪 果 是 [5 6 35020 0 21 
>>> b 条 二 [23 的 洛克 


注意 : 使 用 sort(0 方 法 和 sorted() 方 法 可 以 加 入 参数 。 


列表 的 元 素 可 以 是 各 种 类 型 ， 例 如 字符 串 、 字 典 、 用 户 自己 定义 的 类 。 如 果 不 使 
置 比较 函数 ， 可 以 使 用 参数 : 


sort (cmp=None, key=None, reverse=False) 


时 


sorted (cmp=None, key=None, reverse=False) 


其 中 ，cmp 和 key 都 是 函数 ， 这 两 个 函数 作用 于 列表 的 元 素 上 产生 一 个 结果 ，sorted() 方 法 
根据 这 个 结果 来 排序 。reverse 是 一 个 布尔 值 ， 表 示 是 否 反 转 比较 结果 

cmp(el,e2) 是 带 两 个 参数 的 比较 函数 ， 当 返回 值 为 负数 时 el<e2， 为 0 时 el 一 e2, 为 
正 数 时 el>e2， 默 认为 None， 即 用 内 置 的 比较 函数 。 例 如 : 
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>>>students=[(' 张 海 ', 20) , (' 李 斯 ', 19) , (' 赵 大 强 ', 31), (' 王 硕 ',14)] 
>>>students.sort (cmp=lambda x,y:cmp (x[1],y[1])) 间 按 年 龄 数字 大 小 排序 
>>>students 


结果 如 下 : 
[(' 王 右 "，14)，(' 李 斯 '，19)，(' 张 海 '"，20)，(" 赵 大 强 '，31)] 


key 是 带 一 个 参数 的 函数 ， 用 来 为 每 个 元 素 提 取 比 较 值 。 其 默认 为 None， 即 直接 比较 
每 个 元 素 。 通 常 ，key 比 cmp 快 很 多 ， 因 为 对 每 个 元 素 ，key 只 处 理 一 次 ， 而 cmp 会 处 
理 多 次 。 例 如 : 


>>>students=[ (" 张 海 "',20)，(" 李 斯 ',19)，(" 赵 大 强 ",31)，( "王磊 ' ,14) ] 
>>>students.sort (key=lambda x:x[1]) 
>>>students 


结果 如 下 : 

[0 王 需 "，14)，(" 李 斯 '; 19)。(" 张 海 "，20)，(" 赵 大 强 "，31)] 
用 元 素 已 经 命名 的 属性 做 key: 

students.sort (key=lambda student: student.age) 

operator 函数 来 加 快速 度 ， 上 面 的 排序 等 价 于 : 


>>> from operator import itemgetter, attrgetter 


>>> students.sort (key=itemgetter (2)) 
>>> students.sort (key=attrgetter('age')) 


说 明 : cmp 参数 在 Python3.0 以 后 不 再 支持 ， 所 以 Python3.5 只 能 使 用 key、reverse 
在 本 章 中 需要 按 花色 理 牌 手 手中 的 牌 , 使 用 的 就 是 sort0 排 序 , 参数 key 使 用 的 是 麻将 
牌 的 图 像 ID 属性。 由 于 麻将 牌 的 图 像 ID 是 有 次 序 的 ， 从 而 实现 按 花色 理 牌 。 
def sortPoker2 (cards) : # 按 花色 理 牌 手 手中 的 牌 
n=len (cards) # 元 素 〈 牌 ) 的 个 数 
cards.sort (key=operator.attrgetter ('imageID') )# 按 麻将 牌 的 图 像 ID 属性 排序 
print ("排序 后 ") 


12.4 两 人 麻将 游戏 设计 的 步骤 
12.4.1 设计 麻将 牌 类 


Card.as 为 麻将 牌 类 (继承 按钮 组 件 Button)， 构 造 函数 根据 参数 type 
指定 麻将 牌 的 类 型 ， 参 数 num 指定 麻将 牌 的 点 数 。 从 牌 的 类 型 和 上牌 的 点 数 ” 国 
计算 出 对 应 的 麻将 牌 图 片 。 麻 将 牌 的 所 有 图 片 见 图 12-2 所 示 的 素材 。 视频 讲解 
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| 二 项 目 案例 开发 
从 入 门 到 实战 一 一 息 虫 、 游 戏 和 机 器 学 习 


Card 麻将 牌 类 可 以 实现 麻将 牌 正面 、 背 面 的 显示 以 及 移动 的 功能 。 


#Card 麻将 牌 类 
'''m bFront 表示 是 否 显示 牌 正面 的 标志 
m_nType 表示 牌 的 类 型 饼 =1 条 =2 万 =3 字 牌 =4 
m_nNum 表示 牌 的 点 数 (1 一 9) 
FrontURL 表示 牌 文件 的 URL 路 径 
imageID 表示 牌 自己 的 图 像 编 号 ID 
cardID 表示 牌 自己 在 数组 中 的 索引 ID 
x,y 表示 牌 的 坐标 
# 可 以 实现 麻将 牌 正 面 、 背 面 的 显示 以 及 移动 的 功能 
class Card(Button) : 
# 构 造 函 数 ， 参 数 type 指定 牌 的 类 型 ， 参 数 num 指定 牌 的 点 数 
def _ init _(self,cardtype,num,bm,master): 
Button. init _(self,master) 


self.m nType=cardtype # 牌 的 类 型 饼 =1 条 =2 万 =3 字 牌 =4 

self.m nNum=num # 牌 的 点 数 (1 一 9) 

# 根 据 牌 的 类 型 及 编号 来 设置 牌 文件 的 路 径 及 文件 名 

if self.m nType==1 : ## 桶 〈 饼 ) 
FrontURL="res/nan/1" 

elif self.m nType== 2 : # 条 


FrontURL="res/nan/2" 

elif self.m nType== 3 : # 万 
FrontURL="res/nan/3" 

elif self.m nType== : # 字 牌 
FrontURL="res/nan/4" 


self.img=bm 
self.imageID=self.m nType * 10 + self.m nNum =# 牌 自己 的 图 像 编号 ID 
FrontURL=FrontURL + str(self.m nNum) #URL 地 址 


FrontURL=FronNtURL + " .png" 
self["width"]=51 # 麻 将 牌 方块 的 宽度 
self["height"]=67 # 麻 将 牌 方块 的 高 度 
self["text"]=str (self.imageID)+".png" 
self.setFront (False) 

#self.MoveTo(100, 100) 
self.bind("<ButtonPress>",btn MouseDown) 
self.cardID=0 


def _ cmp_ _(self, other): 
return cmp(self.imageID, other.imageID) 
def setFront (self, b): # 是 否 显 示 牌 正面 
self.m bFront=b 
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FEBEETEUe)F 
self["image"]=self.img 
else: 
self["image"]=back 
def MoveTo(self, xl, yl1): 
self.place (x=x1, y=y1) 
SeLf-.x Xl 
self.y=y1l 
def getx(self): 
return self.x 
def gety (self): 
return self.y 
def getImageID (self) : 


return imageID 


12.4.2 ”设计 游戏 主 程序 


导入 包 及 相关 的 类 : 

from tkinter import * 
import random 

from threading import Timer 
import time 

import operator 


import winsound  ”# 声 音 模 块 
from tkinter.messagebox import * 


创建 窗口 对 象 ，imgs 用 来 存储 麻将 图 片 。 


win=Tk () 

win.title ("两 人 麻将 一 一 夏 敏捷 ") 
win.geometry ("995x750") 
imgs=[] 


back=PhotoImage (file='res\\bei.png') 


m acards=[] 
playersCcard=[[],[]] 
playersoutcard=[[],[]] 
k=0 

m LastCard=None 
PlayerSelectCard=None 
MyTurn=True 


实例 化 “ 吃 牌 ”“ 碰 牌 ”“ 和 牌 ”“ 摸 牌 ” 按 钮 ， 由 
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# 显 示 牌 正面 图 片 


# 显 示 牌 背面 图 片 
# 移 到 指定 的 (x1，y1) 位 置 


# 牌 的 坐标 


# 牌 自己 的 图 像 编号 ID 


---Card end 


视频 讲解 


# 创 建 窗口 对 象 
# 设 置 窗口 标题 


# 存 储 麻将 的 正面 图 片 

# 存 储 牌 的 背面 图 片 

# 存 储 136 张 麻将 牌 的 列表 

# 记 录 两 个 牌 手 拿 到 的 牌 

# 记 录 两 个 牌 手 出 过 的 牌 

# 记 录 已 发 出 牌 的 个 数 

# 用 户 是 否 选 过 牌 

# 用 户 选 中 的 牌 

# 轮 到 玩家 出 牌 ( 游 戏 开始 玩家 先 出 牌 ) 


于 还 未 发 牌 ， 所 以 这 些 按钮 均 设置 
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on 项 目 案例 开发 
从 入 门 到 实战 一 一 爬虫 、 游 戏 和 机 器 学 习 


# 功 能 按钮 

Get btn=Button (win, text=" 摸 牌 "， command=OnBtnGet Click) 
Peng btn=Button (win, text=" 碰 牌 ", command=OnBtnChi Click) 
Chi btn=Button (win, text=" 吃 牌 "， command=OnBtnChi _ Click) 
Out btn=Button (win,text=" 出 牌 "， command=OnBtnOut Click) 
Win btn=Button (win,text=" 和 牌 "，width=70,height=27) 

Win btn.place (x=500,y=600,width=70, height=27) 

Chi btn.place (x=600, y=600,width=70, height=27) 

Peng btn.place (x=700,y=600,width=70,height=27) 

Out btn.place (x=800,y=600,width=70, height=27) 

Get btn.place (x=900,y=600,width=70, height=27) 


#Get btn.pack forget () # 隐 藏 button 

#Get btn["state"]=DISABLED ##“ 摸 牌 ”按钮 无 效 
Peng btn["state"]=DISABLED #“ 磁 牌 ”按钮 无 效 
Chi ptn["state"]=DISABLED #“ 吃 牌 ”按钮 无 效 
Out btn["state"]=DISABLED #“ 出 牌 ”按钮 无 效 
Win btn["state"]=DISABLED #“ 和 有 牌 ”按钮 无 效 
BeginGame () # 开 始 游戏 ， 玩 家 先 出 牌 


win.mainloop () 

BeginGame() 函 数 加 载 136 张 麻将 牌 到 舞台 ， 同 时 重 置 游 戏 ， 完 成 洗 牌 功能 ， 即 随机 交 
换 m_aCards 中 的 两 张 牌 ， 并 将 136 张 麻将 牌 的 背面 显示 在 舞台 上 ， 设 置 两 家 26 张 初始 麻 
将 牌 的 位 置 。 


def BeginGame () : # 开 始 游戏 ， 玩 家 先 出 牌 
MyTurn=True 
Loadcards () # 加 载 136 张 麻将 牌 到 舞台 
random. shuffle (m aCards) # 洗 牌 操作 ， 将 列表 中 的 元 素 打 乱 
ResetGame () # 初 始 发 26 张 牌 给 玩家 和 计算 机 
LoadCards() 创 建 136 张 麻将 牌 ， 并 将 牌 添加 到 游戏 舞台 和 m_aCards 列表 (数组 ) 中 。 
def LoadCards () : # 加 载 136 张 麻将 牌 到 舞台 
for m nType in range(1,4) : #1 一 3 代表 饼 、 条 、 万 
for num in range(1,10): #1~9 
# 根 据 牌 的 类 型 及 编号 来 设置 牌 文件 的 路 径 及 文件 名 
if m nType==1: # 桶 〈 饼 7 
FrontURL="res/nan/1" 
elif m nType==2 : # 条 
FrontURL="res/nan/2" 
elif m nType==3 : # 万 


FrontURL="res/nan/3" 


FrontURL=FrontURL+str (num) #0RL 地 址 


| 238 


第 12 章 娱乐 游戏 一 两 人 麻将 游戏 1 2 


FrontURL=FrontURL+" .png™" 

imgs .append (PhotoImage (file=FrontURL)) 

Eor Tl Tn rangel(llr 5): #1 一 4， 每 种 牌 4 张 
card=Card (m nType, num, imgs [len (imgs) -1], win)# 创 建 “ 饼 、 条 、 万 ” 牌 
#card.MoveTo (100+num*60,100+m nType*80) 


m aCards .append (card) ## 将 牌 添加 到 列表 〈 数 组 ) 
cardtype=4 # 字 牌 
for num in range (1,8) : #1 一 7，7 种 字 牌 
FrontURL="res/nan/4" 
FrontURL=FrontURL+str (num) #URL 地 址 


FrontURL=FrontURL+" .png" 

imgs .append (PhotoImage (file=FrontURL)) 

for n in range(1,5) : # 每 种 牌 4 张 
card=Card (cardtype, num, imgs[len (imgs)-1],win) # 创 建 字 牌 
#card.MoveTo (100+num*60, 100+4*80) 
#card["state"]=DISABLED 
m acards.append (card) # 将 牌 添加 到 列表 (数组 ) 


ResetGame() 在 洗 牌 操作 后 将 136 张 麻 将 牌 的 背面 显示 在 舞台 上 ， 并 完成 发 牌 功能 ， 共 
发 给 两 个 玩家 26 张 麻 将 牌 ， 同 时 设置 26 张 初始 麻将 牌 的 位 置 。 


def ResetGame () : # 发 给 两 家 26 张 麻将 牌 
playerscard[0]=[] # 玩 家 手中 的 牌 
playersCcard[1]=[] # 计 算 机 的 牌 
for n in range(0,1en(m aCards)): # 重 新 设置 136 牌 在 场景 中 的 位 置 


m aCards [n] .x=90+20* (n%34) 

m aCards [n] .y=170+55* (n-n%34) /34 

m aCards [n] .MoveTo (m aCards[n] .x, m aCards[n].y) 
#m aCards [n] .setComponentZOrder (m aCards[n], n) 


m aCards[n] .setFront (False) # 显 示 麻 将 牌 的 背面 
# 开 始 发 牌 
Shiftcards () 
m LastCard=None # 上 次 用 户 所 选择 的 卡片 
playersoutcard[0]=[] # 玩 家 出 过 的 牌 
playersoutcard[1]=[] # 计 算 机 出 过 的 牌 


ShiftCards0) 发 给 两 个 玩家 26 张 麻将 牌 ， 每 个 玩家 发 完 13 张 牌 以 后 ， 需 要 调用 
sortPoker2(cards) 按 花色 理 牌 手 手中 的 牌 。 


def ShiftCards(): 


global Kk 

for k in range(0,26) : # 发 牌 ， 设 置 最 初 发 的 26 张 麻将 牌 的 位 置 
Shift (k) 

print ("玩家 按 花 色 理 手 中 的 牌 ") 

sortPoker2 (PlayersCard[0]) # 玩 家 按 花 色 理 手中 的 牌 


print ("计算 机 按 花色 理 手中 的 牌 ") 
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从 入 门 到 实战 一 一 爬虫 、 游 戏 和 机 器 学 习 


SortPoker2 (playersCard[1]) # 计 算 机 按 花 色 理 手中 的 牌 
OuterPlayerNum=0 # 出 牌 人 数 为 0 
k=26 # 发 牌 数量 


Shift0 设 置 最 初 26 张 麻 将 牌 的 位 置 ， 并 且 给 发 给 玩家 的 麻将 牌 加 上 "<ButtonPress>" 事 
件 监听 ， 当 单 击 麻将 牌 时 系统 将 调用 btn_ MouseDown() 事 件 函数 ， 对 发 给 玩家 的 对 家 《〈 计 
算 机 ) 的 麻将 牌 则 不 需要 监听 。 


def Shift (K) : “## 设 置 每 张 麻将 牌 的 位 置 
#global k 
#print ('running', k) 
i=k%2 
j=(k-k%2) /2 
if i==0 : # 玩 家 自己 
m aCards[k] .setFront (True) # 显 示 麻 将 牌 的 正面 
m aCards[k] -MoveTo (80+55*j, 500) 
# 监 听 每 张 麻 将 牌 ， 当 单 击 麻将 牌 时 系统 将 调用 btn_MouseDown () 


m aCards[k] .bind("<ButtonPress>",btn MouseDown) 


elif i==1 : # 玩 家 的 对 家 〈 计 算 机 ) 
m aCards[k] .MoveTo (80+55 * j, 80) 
m aCards [k] .setFront (True) # 显 示 麻 将 牌 的 正面 


playersCard[ (ks2) ] .append (m_aCcards [k] ) # 按 顺序 存储 到 记录 两 个 牌 手 的 牌 的 数组 


sortPoker2(cards) 按 花色 理 玩家 手中 的 牌 。 由 于 imageID 是 按照 花色 编号 的 ， 所 以 按照 
imageID 大 小 排序 就 可 以 了 。 


def sortPoker2 (cards) : # 按 花色 理 牌 手 手中 的 牌 
n=len (cards) # 元 素 ( 牌 ) 的 个 数 
# 排 序 


cards.sort (key=operator.attrgetter ('imageID')) 
print ("排序 后 ") 
for index in range(0,n): # 重 新 设置 各 张 牌 在 场景 中 的 位 置 
Print(cards [index] .imageID) 
newx=90+55*index 
y=cards [index] .getY () 
cards [index] .MoveTo (newx, y) 
cards [index] .cardID=index 


玩家 手中 的 牌 可 以 响应 鼠标 单 击 ， 当 用 户 选 麻将 牌 时 系统 将 调用 btn_ MouseDownO 事 
件 函 数 。 另 外 ， 通 过 event.widget 可 以 获取 用 户 选 的 麻将 牌 对 象 ， 将 此 牌 上 移 20 像素 。 如 
果 已 经 选 过 牌 ， 则 还 需要 将 已 经 选 过 的 牌 下 移 20 像素 。 

# 当 用 户 选 麻将 牌 时 系统 将 自动 调用 此 函数 

def btn MouseDown (event): # 鼠 标 单 击 按 下 事件 函数 


global m LastCard,PlayerSelectCard 


if event.widget["state"]==DISABLED: 


return 
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if(event.widget.m bFront==False): 
return 
# 找 到 相应 的 麻将 牌 对 象 
card=event .widget #event .widget 获取 触发 事件 的 对 象 
card.y-=20 
card.place (x=event .widget .x,y=event .widget.y) 
if(m LastCard==None) : # 未 选 过 的 牌 
m LastCard=card 
PlayerSelectCard=card 
else: # 已 经 选 过 的 牌 
m_LastCard.MoveTo (m LastCard.getx(),m LastCard.getY()+20)# 下 移 20 像素 
m LastCard=card 
PlayerSelectCard=card 


以 下 是 4 个 按钮 的 单 击 事件 处 理 。 

在 “ 摸 牌 ”按钮 单 击 事件 中 ,将 m_aCards[k] 牌 移动 到 玩家 牌 所 在 的 位 置 ， 并 按 花 色 排 
序 理 牌 ， 调 用 ComputerCardNum(playersCard[0]) 计 算 玩 家 手中 各 种 牌 型 的 数量 并 判断 是 否 
和 牌 ， 如 果 和 牌 则 游戏 结束 。 


def OnBtnGet Click() : #“ 摸 牌 ”按钮 事件 
global Kk 
global playersCard,MyTurn 
# 玩 家 按 花 色 理 手 中 的 牌 
m aCards[k] .MoveTo (90+55*13, 500) 
m aCards[k] .setFront (True) # 显 示 麻 将 牌 的 正面 
print (" 玩 家 手中 牌 1111", len (playersCard[0])) 
playersCard[0] .append (m aCards[k]) # 第 14 张 牌 
# 监 听 第 14 张 牌 
m aCards[k] .bind ("<ButtonPress>",btn MouseDown) 
print ("玩家 手中 牌 2222", len (playersCcard[0])) 


sortPoker2 (playersCard[0]) # 按 顺序 存储 到 记录 有 牌 手 的 牌 的 数组 
result1=ComputerCardNum (playersCard[0] )## 计 算 牌 手 手 中 各 种 牌 型 的 数量 , 判断 是 否 和 牌 
if(result1) : # 和 牌 了 


Win btn["state"]=NORMAL 
showinfo (title=" 恭 喜 ",message=" 玩 家 Winln) 


return # 玩 家 不 需要 再 出 牌 
k=k+1 # 下 一 张 要 摸 的 牌 在 m acards 中 的 索引 号 
Out btn["state"]=NORMAL #“ 出 牌 ”按钮 有 效 
chi ptn["state"]=DISABLED #“ 吃 牌 ”按钮 无 效 
Peng btn["state"]=DISABLED #“ 碰 牌 ”按钮 无 效 
Get btn["state"]=DISABLED #“ 摸 牌 ”按钮 无 效 


MyTurn=True 


在 “出 牌 ”按钮 单 击 事件 中 ， 将 被 选中 的 牌 PlayerSelectCard 移 到 左 侧 ， 并 从 
playersCard[0] 中 删除 被 选中 的 牌 PlayerSelectCard， 轮 到 计算 机 出 牌 时 ，ComputerOutO 实 
现 计算 机 智能 出 牌 。 
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从 入 门 到 实战 一 一 看 虫 、 游 戏 和 机 器 学 习 


def OnBtnout Click(): 


global MyTurn 
global PlayerSelectCard,m LastCard,MyTurn 
print ("出 牌 ") 


if (MyTurn==False): # 没 轮 到 自己 出 牌 
return 

if (PlayerSelectCard==None): # 还 没 选择 出 的 牌 
showinfo (title=" 提 示 ",message=" 还 没 选择 出 的 牌 ") 
return 


print (PlayerSelectCard) 
if not (PlayerSelectCard==None): 
Out btn["state"]=DISABLED 才 “ 出 牌 ”按钮 无 效 
playersoutCard[0] .append (PlayerSelectCard) 7 
PlayerSelectCard.x=len (playersoutcard[0])*25-25; # 移 动 被 选中 的 牌 
PlayerSelectCard.y=420; 
PlayerSelectCard.MoveTo (PlayerSelectCard.x, PlayerselectCard.y); 
#outCardorder (playersoutcard[0]);  # 整 理 玩家 出 的 牌 的 z 轴 深 度 
# 玩 家 有 牌 减少 
print (PlayerSelectCard.cardID) 
del (playersCard[0] [PlayerSelectCard.cardID]) 
#playersCard[0] .remove (PlayerSelectCard); 
m LastCard=None 
PlayerSelectCard=None 
MyTurn=False 
Out btn["state"]=DISABLED 
Computerout () # 计 算 机 智能 出 牌 
fun2 () # 游 戏 顺 序 逻 辑 控制 


对 于 碰 、 吃 牌 ， 这 里 不 再 区 分 处 理 ， 仅 仅 将 对 家 的 牌 加 入 玩家 自己 的 playersCard[0] 
列表 (数组 ) 中 ， 对 playersCard[0] 记 录 的 牌 进行 排序 ， 从 而 达到 理 牌 目的 。 最 后 计算 牌 手 
手中 各 种 牌 型 的 数量 ， 判 断 是 否 和 牌 ， 如 果 和 牌 则 “出 牌 ”按钮 无 效 ， 否 则 “出 牌 ”按钮 
出 现 ， 玩 家 选择 牌 后 可 以 出 牌 。 

# 对 于 碰 、 吃 牌 ， 这 里 不 再 区 分 处 理 

def onBtnchi click() : #“ 吃 牌 ”按钮 单 击 事件 
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global MyTurn 
card=playersOoutCard[1] [len (playersoutcard[1])-1]; 
card.MoveTo (90+55*13, 500); 


card.setFront (True); # 显 示 麻将 牌 的 正面 
playersCard[0] .append (card); # 第 14 张 牌 
# 监 听 第 14 张 牌 


#card.bind ("<ButtonPress>",btn MouseDown)  ## 不 绑 定 事 件 ， 可 以 防止 此 牌 被 玩家 再 次 出 
print (" 碰 吃 的 牌 是 ",card.imageID) 

sortPoker2 (PlayersCard[0]) :7 # 按 顺序 存储 到 记录 玩家 的 牌 的 列表 (数组 ) 中 
result1=ComputerCardNum (playersCard[0] ) ;# 计 算 牌 手 手中 各 种 牌 型 的 数量 ， 判 断 是 否 和 上 牌 
if(result1) : 共和 牌 了 
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Win btn["state"]=NORMAL 
Out btn["state"]=DISABLED ”站 “出 牌 ” 按 钮 无 效 
showinfo (title=" 恭 喜 ",message=" 玩 家 Winlm) 


return # 玩 家 不 需要 再 出 牌 
Out btn["state"]=NORMAL #“ 出 牌 ”按钮 有 效 
Get btn["state"]=DISABLED #“ 摸 牌 ”按钮 无 效 
Chi ptn["state"]=DISABLED #“ 吃 牌 ”按钮 无 效 
Peng btn["state"]=DISABLED #“ 碰 牌 ”按钮 无 效 


MyTurn=True 


fun20 实 现 游戏 过 程 中 出 牌 顺序 的 控制 逻辑 。 在 游戏 中 有 两 个 牌 手 ， 一 个 是 玩家 自己 
(0 号 牌 手 ), 一 个 是 计算 机 (1 号 牌 手 )。 在 玩家 出 牌 后 系统 自动 调用 ComputerOut0 实 现 计 
算 机 智能 出 牌 ， 这 时 又 轮 到 玩家 出 牌 ， 需 要 判断 计算 机 出 的 牌 玩 家 是 否 可 以 吃 、 磁 ， 如 果 
可 以 ， 则 “ 吃 牌 ”“ 碰 牌 ”按钮 有 效 。 


def fun2(): # 出 牌 顺序 控制 
MyTurn=True # 轮 到 玩家 出 牌 
Get ptn["state"]=NORMAL #“ 摸 牌 ”按钮 有 效 


if(len (playersoutCard[1])>0): 
# 取 计算 机 出 的 牌 ， 即 最 后 一 张 
card=playersOoutCard[1] [len (playersOoutCcard[1])-1] 
# 判 断 计 算 机 出 的 牌 玩家 是 否 可 以 吃 、 碰 
if (canPeng (playersCcard[0],card)):  # 玩 家 是 否 可 以 碰 牌 


Peng btn["state"]=NORMAL #“ 碰 牌 ” 按 钮 有 效 
if (canChi (playersCard[0],card)): # 玩 家 是 否 可 以 吃 牌 
Chi btn["state"]=NORMAL #“ 吃 牌 ”按钮 有 效 


# 不 能 吃 、 碰 则 只 能 直接 摸 牌 

if ( not canChi (playersCard[0],card) and not canPeng (playersCard[0],card) ) : 
Peng btn["state"]=DISABLED 
Chi btn["state"]=DISABLED 


#OnBtnGet Click(); # 直 接 摸 牌 
else: 井 计 算 机 没 出 过 牌 直接 摸 牌 
Get btn["state"]=NORMAL #“ 摸 牌 ”按钮 有 效 


为 了 实现 在 不 能 吃 、 碰 的 情况 下 自动 摸 牌 , 不 需要 等 玩家 单 击 “ 摸 牌 ”按钮 后 才 摸 牌 ， 
可 以 将 上 面 的 “直接 摸 牌 ” 行 的 注释 取消 掉 ， 这 样 就 可 以 减少 让 玩家 摸 牌 的 麻烦 ， 但 是 如 
果 可 以 选择 吃 、 碰 ， 这 时 还 是 可 以 让 玩家 单 击 “ 摸 牌 ” 按 钮 的 ， 因 为 玩家 可 以 放弃 吃 、 碰 。 

ComputerOut(Order:inb 实现 计算 机 智能 出 牌 ， 首 先 将 m_aCards[k] 牌 移动 到 对 家 
(计算 机 ) 牌 所 在 的 位 置 ， 并 按 花色 排序 理 牌 。 调 用 ComputerCardNum(playersCard[0]) 计 
算 牌 手 手中 各 种 牌 型 的 数量 并 判断 是 否 和 牌 ， 如 果 和 上 牌 则 游戏 结束 ， 否 则 调用 
ComputerCard (playersCard[1]) 智 能 出 牌 。 


def Computerout () : ## 计 算 机 智能 出 牌 
global k,MyTurn 
# 对 家 《计算 机 ) 摸 牌 
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从 入 门 到 实战 一 一 仆 虫 、 游 戏 和 机 器 学 习 

m aCards[k] -MoveTo (90+55*13, 80); 

m aCards[k] .setFront (True); # 显 示 麻 将 牌 正面 


playersCard[1] .append (m aCards[k]); # 第 14 张 牌 
result1=ComputerCardNum (playersCard[1]);# 计 算计 算 机 的 各 种 牌 型 的 数量 ， 判 断 是 否 和 牌 


if(result1): # 和 牌 了 

showinfo (title=" 遗 憾 ", message=" 计 算 机 Win!") 

return; ## 对 家 〈 计 算 机 ) 不 需要 再 出 牌 
i=ComputerCard (playersCard[1]); # 智 能 出 牌 
0 # 总 是 出 第 1 张 牌 ， 没 有 智能 出 牌 


card=playersCard[1] [i] 
del (playersCard[1] [i]) 


# 加 到 计算 机 出 过 牌 的 数组 

playersoutCard[1] .append (card) 

#outCardorder (playersoutcard[1]); # 整 理 出 过 的 牌 ，z 轴 深 度 问 题 
card.setFront (True); # 显 示 麻 将 牌 正面 

PlaySound (card) # 根 据 计 算 机 出 牌 选 择 声音 文件 播放 
# 计 算 机 按 花 色 理 手中 的 牌 


sortPoker?2 (playersCard[1]); 
card.x=len (playersOutCard[1])*25-25; 


card.y=10; 

card.MoveTo (card.x, card.y); 

k=k+1 # 发 过 有 牌 的 总 数 
MyTurn=True # 轮 到 玩家 


playSound(card) 实 现 播放 牌 对 应 的 声音 文件 。 


def playSound (card) : 
#music="res/sound/ 二 条 .wav"; 
# 根 据 牌 的 类 型 及 编号 来 设置 牌 文件 的 路 径 及 文件 名 
music="res/sound/"+toChineseNumstring (card.m nNum); 
if card.m nType==1: # 桶 〈 饼 7 
music+=" 柄 .wav"; 
elif card.m nType==2: # 条 
music+=" 条 .wav"; 
elif card.m nType==3: # 万 
music+=" 万 .wav"; 
elif card.m nType==4: # 字 牌 
music="res/sound/give.wav"; 
winsound.PlaySsound (music, winsound.SsND FILENAME) 


F 声音 文件 名 是 汉字 ， 例 如 “一 万 mp3”“ 二 万 mp3”， 所 以 在 计算 机 出 牌 时 
toChineseNumString(n:int) 将 牌 面 的 数字 转换 成 汉字 。 


def tochineseNumString (n) : 
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music=" 六 " 


return music 


def ComputerCardNum(cards) : 
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# 计 算 牌 手 手中 各 种 牌 型 的 数量 
paiArray=[[0,0,0,0,0,0,0,0,0,0], 
[0,0,0,0,0,0,0,0,0,0], 
[0,0,0,0,0,0,0,0,0,0], 
[0,0,0,0,0,0,0,0,0,0]] 
print ("玩家 手中 的 牌 ", len (cards) ) 
for i in range(0,14): 


card=cards [i] 


if(card.imageID>10 


paiArray 
paiArray 


0] 
0] 


if(card.imageID>20 


PaiRArray 
paiArray 


1] 
1] 


if(card.imageID>30 


paiArray 
paiArray 


2] 
2] 


if (card.imageID>40 


paiArray 


paiArray 


print (paiArray) 


3] 
3] 


and card.imageID<20): 


0]+=1 
card.imageID-10 


al 
0]+=1 
C 


ard.imageID-20 


a 

0]+=1 
card.imageID-30 
and card.imageI 
oi1+=1 


card.imageID-40 


+=1 


nd card.imageID<30): 


-= 


nd card.imageID<40): 


让 


全 


D<50) : 


在 和 牌 算 法 中 需要 计算 每 种 花色 麻将 牌 的 数量 以 及 每 种 牌 型 的 数量 ， 
ComputerCardNum(cards) 根 据 cards 计算 出 数据 按 和 牌 的 数据 结构 存 入 paiArray 中 , 调用 和 
牌 算法 类 中 的 Win(paiArray) 判 断 是 否 和 牌 。 


# 玩 家 手中 的 牌 


# 饼 


# 条 


# 万 


# 字 


Bs 项 目 案 例 开发 


从 入 门 到 实战 一 一 怎 虫 、 游 戏 和 机 器 学 习 


hu=huMain () # 和 有 牌 算法 类 
result=hu.Win (paiArray) # 判 断 是 否 和 牌 
return result 


本 两 人 麻将 游戏 还 有 许多 地 方 需要 完善 ， 例 如 碰 、 吃 牌 功能 ， 需 要 记录 哪 几 张 牌 “ 吃 ” 
和 “ 碰 ” 这 几 张 牌 不 能 再 出 , 可 以 通过 在 Card 类 里 增加 Selected 属性 来 记录 是 否 用 于 “ 吃 ” 
和 “ 碰 ”, 这样 玩 家 选择 出 牌 时 判断 Selected 属性 的 真 假 就 可 以 知道 是 否 能 出 .另外 还 有 “ 杠 ” 
的 处 理 ， 本 游戏 没有 考虑 ， 读 者 可 以 进一步 去 完善 。 本 游戏 的 运行 界面 如 图 12-3 所 示 。 


图 12-3 两 人 麻将 游戏 的 运行 界面 


| 246 


13.1 基于 TCP 的 在 线 聊天 程序 简介 


本 章 基 于 TCP 完成 一 个 在 线 聊天 程序 ， 主 要 功能 是 实现 客户 端 与 服务 器 端的 双向 通 
信 ， 运 行 效果 如 图 13-1 所 示 。 


和 
全 2016-08-02 09:06:57 世 : 


引 S| 
-| -| 
;| 
EE 本 和 EE | 


图 13-1 在 线 聊天 的 服务 器 端 与 客户 端 


13.2 ”关键 技术 
13.2.1 互联 网 TCP/IP 协议 


计算 机 为 了 连 网 ， 必 须 规定 通信 协议 ， 早 期 的 计算 机 网 络 都 是 由 各 厂商 自己 规定 一 套 


| 项 目 案例 开发 

从 入 门 到 实战 一 一 爬虫 、 游 戏 和 机 器 学 习 

协议 ，IBM、Apple 和 Microsoft 公司 都 有 各 自 的 网 络 协议 ， 互 不 兼容 ， 这 就 好 比 一 群 人 有 
的 说 英语 ， 有 的 说 中 文 ， 有 的 说 德语 ， 说 同一 种 语言 的 人 可 以 交流 ， 说 不 同 语言 的 就 不 
行 了 。 

为 了 把 全 世界 的 所 有 不 同类 型 的 计算 机 都 连接 起 来 ， 必 须 规 定 一 套 全 球 通用 的 协议 ， 
为 了 实现 互联 网 这 个 目标 , 国际 组 织 制 定 了 OSI 七 层 模型 互联 网 协议 标准 ,如 图 13-2 所 示 。 
因为 互联 网 协议 包含 了 上 百 种 协议 标准 ， 但 是 其 中 最 重要 的 两 个 协议 是 TCP 和 卫 协议 ， 
所 以 大 家 把 互联 网 协议 简称 TCP/IP 协议 。 


网 络 层 网 络 层 
| | 数据 链 路 层 | ARP 硬件 接口 RARP | 数据 链 路 层 
物理 层 


图 13-2 互联 网 协议 


13.2.2 ”IP 协议 和 端口 


各 了 正 协 议 

在 通信 的 时 候 ， 双 方 必 须知 道 对 方 的 标识 ， 这 好 比 发 邮件 必须 知道 对 方 的 邮件 地 址 一 
样 。 互 联网 上 每 台 计 算 机 的 唯一 标识 就 是 卫 地 址 ， 类 似 于 202.196. 32.7。 如 果 一 台 计 算 机 
同时 接 入 到 两 个 或 更 多 的 网 络 ， 例 如 路 由 器 ， 它 就 会 有 两 个 或 多 个 他 地 址 ， 所 以 了 P 地 址 
对 应 的 实际 上 是 计算 机 的 网 络 接口 ， 通 常 是 网 卡 。 

IP 协议 负责 把 数据 从 一 台 计 算 机 通过 网 络 发 送 到 另 一 台 计算 机 。 数 据 被 分 割 成 一 小 
块 、 一 小 块 ,然后 通过 他 包 发 送出 去 。 由 于 互联 网 链 路 复杂 ， 两 台 计 算 机 之 间 经 常 有 多 条 
线路 ， 因 此 路 由 器 就 负责 决定 如 何 把 一 个 IP 包 转 发 出 去 。IP 包 的 特点 是 按 块 发 送 ， 途 经 
多 个 路 由 ， 但 不 保证 能 到 达 ， 也 不 保证 顺序 到 达 。 

卫 地 址 实际 上 是 一 个 32 位 整数 ( 称 为 IPv4)， 以 字符 串 表示 的 他 地 址 如 192.168.0.1， 
实际 上 是 把 32 位 整数 按 8 位 分 组 后 的 数字 表示 ， 目 的 是 便于 用 户 阅 读 。 
IPv6 地 址 实际 上 是 一 个 128 位 整数 ， 它 是 目前 使 用 的 IPv4 的 升级 版 ， 以 字符 串 表 示 ， 
类 似 于 2001:0db8:85a3:0042:1000:8a2e:0370:7334。 

四 端口 

一 个 中 包 除 了 包含 要 传输 的 数据 外 ， 还 包含 源 他 地 址 和 目标 瑟 地 址 、 源 端口 和 目标 
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端口 。 

端口 有 什么 作用 ? 在 两 台 计 算 机 通信 时 只 发 人 P 地 址 是 不 够 的 , 因为 同一 台 计 算 机 上 运 
行 着 多 个 网 络 程序 (例如 浏览 器 、QQ 等 网 络 程序 )。 在 一 个 IP 包 来 了 之 后 ， 到 底 是 交 给 
浏览 器 还 是 QQ， 需 要 端口 号 来 区 分 。 每 个 网 络 程序 都 向 操作 系统 申请 唯一 的 端口 号 ， 这 
样 两 个 进程 在 两 台 计 算 机 之 间 建 立 网 络 连接 就 需要 各 自 的 IP 地 址 和 各 自 的 端口 号 。 例如 浏 
览 器 经 常 使 用 80 端口 ，FTP 程序 使 用 21 端口 ， 邮 件 的 收 /发 使 用 25 端 

网 络 上 两 台 计 算 机 之 间 的 数据 通信 ， 归 根 结 二 底 就 是 不 同 主机 的 进程 交互 ， 而 每 个 主机 
的 进程 又 对 应 着 某 个 端口 。 也 就 是 说 ， 单 独 靠 IP 地 址 是 无 法 完成 通信 的 ， 必 须要 有 卫 和 
端口 。 


13.2.3 TCP 协议 和 UDP 协议 


TCP 协议 建立 在 人 P 协议 之 上 。TCP 协议 负责 在 两 台 计算 机 之 间 建 立 可 靠 连接 ， 保 证 
数据 包 按 顺序 到 达 。TCP 协议 会 通过 握手 建立 连接 ,然后 对 每 个 人 P 包 编号 , 确保 对 方 按 顺 
序 收 到 ， 如 果 包 丢掉 了 ， 就 自动 重 发 。 

许多 常用 的 更 高 级 的 协议 都 是 建立 在 TCP 协议 基础 上 的 , 例如 用 于 浏览 器 的 HITP 协 
议 、 发 送 邮件 的 SMTP 协议 等 。 

UDP 协议 同样 建立 在 IP 协议 之 上 , 但 是 UDP 协议 面向 无 连接 的 通信 协议 ， 不 保证 数 
据 包 的 顺利 到 达 ， 是 不 可 靠 传 输 ， 所 以 效率 比 TCP 要 高 。 


13.2.4 Socket 


Socket 是 网 络 编程 的 一 个 抽象 概念 。Socket 是 套 接 字 的 英文 名 称 ， 主 要 是 用 于 网 络 通 
信 编 程 。 在 20 世纪 80 年 代 初 ， 美 国政 府 的 高 级 研究 工程 机 构 ARPA) 给 加 利 福 尼 亚 大 
学 的 Berkeley 分 校 提供 了 资金 ， 让 他 们 在 UNIX 操作 系统 下 实现 TCP/IP 协议 。 在 这 个 项 
目 中 , 研究 人 员 为 TCP/IP 网 络 通信 开发 了 一 个 API( 应 用 程序 接口 ), 这 个 API 称 为 Socket 
( 套 接 字 )。Socket 是 TCP/IP 网 络 最 为 通用 的 API， 任 何 网 络 通信 都 是 通过 Socket 来 完 
成 的 。 

通常 用 一 个 Socket 表示 “打开 了 一 个 网 络 链接 ”， 而 打开 一 个 Socket 需要 知道 目标 计 
算 机 的 下 地 址 和 端口 号 ,再 指定 协议 类 型 。 

套 接 字 构造 函数 socket(family.type[.protocol]) 使 用 给 定 的 套 接 字 家 族 、 套 接 字 类 型 、 协 
议 编号 来 创建 套 接 字 
其 参数 如 下 。 
。 family: 套 接 字 家 族 ， 可 以 是 AF_UNIX 或 者 AF INET、AF INET6。 
。 type: 套 接 字 类 型 ， 可 以 根据 是 面向 连接 的 还 是 非 连接 的 分 为 SOCK_STREAM 和 

SOCK DGRAM., 

。 protocol: 一 般 不 填 ， 默 认为 0。 
参数 的 取 值 的 含义 见 表 13-1。 
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表 13-1 参数 的 取 值 含义 
参数 描 述 
socket.AF UNIX 只 能 够 用 于 单一 的 Unix 系统 进程 间 通 信 
socket.AF INET 服务 器 之 间 的 网 络 通信 


socket.AF INET6 


IPv6 


socket.SOCK STREAM 


流 式 Socket， 针 对 TCP 


socket.SOCK DGRAM 


数据 报 式 Socket， 针 对 UDP 


socket.SOCK RAW 


原始 套 接 字 ， 首 先 ， 普 通 的 套 接 字 无 法 处 理 ICMP、IGMP 等 网 络 
报 文 ， 而 SOCK_RAW 可 以 ; 其 次 ，SOCK_RAW 也 可 以 处 理 特 
殊 的 IPv4 报 文 ; 此 外 ,利用 原始 套 接 字 ,可 以 通过 IP_HDRINCL 
套 接 字 选 项 由 用 户 构造 瑟 头 


socket.SOCK SEQPACKET 


例如 创建 TCP Socket: 


可 靠 的 连续 数据 包 服务 


5s=socket .socket (socket .AF INET, socket.SOCK STREAM) 


创建 UDP Socket: 


5=socket .socket (socket .AF INET, socket.SOCK DGRAM) 


Socket 同时 支持 数据 流 Socket 和 数据 报 Socket。 图 13-3 是 面向 连接 支持 数据 流 TCP 
的 时 序 图 。 
服务 器 
Socket() 
了 
Bind() 
L 客户 机 
Listen() 
Socket() 
阻塞 ， 户 数据 建立 连接 T 
Connect() 
Accept() 
' 请 求 数据 ! 
Recieve() Send() 
1 
服务 器 处 理 请 求 
! 应 答 数据 TY 
Send() Recieve() 
1 1 
Close() Close() 
图 13-3 面向 连接 TCP 的 时 序 图 
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对 于 TCP'C/S， 


务 器 与 客户 机 开始 都 必须 调 朋 


时， 客户 机 〈Client) 与 服务 器 (Server) 的 关系 是 不 对 称 的 。 
服务 器 首先 启动 ， 然 后 在 某 一 时 刻 启动 客户 机 与 服务 器 建立 连接 。 服 
日 Socket() 建 立 一 个 套 接 字 ， 然 后 服务 器 调用 Bind() 将 套 接 字 


指定 端 


绑 定 在 一 起 ， 再 调用 Listen0 使 套 接 字 处 于 一 种 被 动 的 准备 接收 状态 ， 


与 一 个 本 


这 时 客户 机 
Accept() 来 接收 客户 
从 而 实现 多 个 客户 忆 


建立 套 接 字 便 可 以 通过 调 


Connect() 和 服务 器 建立 连接 ， 服 务 器 就 可 以 调 
机 连接 。 然 后 继续 监听 指定 端口 ， 并 发 出 阻塞 ， 直 到 下 一 个 请 求 出 现 
连接 。 在 连接 建立 之 后 ， 客 户 机 和 服务 器 之 间 就 可 以 通过 连接 发 送 条 


了 


接收 数据 。 最 后 ， 待 数据 传送 结束 ， 双 方 调用 Close0 关 闭 套 接 字 。 
在 Python 的 Socket 模块 中 Socket 对 象 提供 的 函数 如 表 13-2 所 示 。 


表 13-2 Socket 对 象 的 函数 


函数 描 述 
服务 器 端 套 接 字 函数 
绑 定 地 址 (hosbport) 到 套 接 字 ， 在 AF_INET 下 以 元 组 (host,port) 的 形式 
s.bind(host,port) 


s.listen(backlog) 


s.accept() 
客户 端 套 接 字 函数 


s.connect(address) 


s.connect ex() 


表示 地 址 
开始 TCP 监听 。backlog 指定 在 拒绝 连接 之 前 可 以 的 最 大 连接 数量 。 该 值 至 
少 为 1， 大 部 分 应 用 程序 设 为 5 就 可 以 了 

被 动 接受 TCP 客户 端 连 接 ，( 阻 塞 式 ) 等 待 连接 的 到 来 


主动 与 TCP 服务 器 连接 。 一 般 address 的 格式 为 元 组 (hostname,port)， 如 
果 连 接 出 错 ， 返 回 socket.error 错误 
connectO 函 数 的 扩展 版 本 ， 出 错时 返回 出 错 码 ， 而 不 是 抛 出 异常 


公共 用 途 的 套 接 字 函 数 
接收 TCP 数据 , 数据 以 字 节 串 形式 返回 。bufsize 指定 要 接收 的 最 大 数据 量 。 
ee flag 提供 有 关 消 息 的 其 他 信息 ， 通 常 可 以 忽略 
i 发 送 TCP 数据 ， 将 data 中 的 数据 发 送 到 连接 的 套 接 字 。 其 返回 值 是 要 发 送 
Ssend(dafe) 的 字 节 数量 ， 该 数量 可 能 小 于 data 的 字 节 大 小 
完整 发 送 TCP 数据 ， 将 data 中 的 数据 发 送 到 连接 的 套 接 字 ， 但 在 返回 之 前 
s.sendall(data) 


会 尝试 发 送 所 有 数据 。 如 果 成 功 ， 返 回 None， 如 果 失 败 ， 抛 出 异常 


_ 接收 UDP 数据 ， 与 recv0 类 似 ， 但 返回 值 是 (data,address)。 其 中 ，data 是 

srecviomm(bufsizeLflag] | 包 全 接收 数据 的 字 节 申 ，address 是 发 送 数据 的 套 接 字 地 址 

发 送 UDP 数据 ， 将 数据 发 送 到 套 接 字 ，address 是 形式 为 (ip,port) 的 元 组 ， 
s.sendto(data,address) 指定 远程 地 址 。 其 返回 值 是 发 送 的 字 节 数 
s.close|) 关闭 套 接 字 
s.getpeername() 返回 连接 套 接 字 的 远程 地 址 ， 其 返回 值 通常 是 元 组 〈ipaddrport) 
s.getsockname() 返回 套 接 字 自 己 的 地 址 ， 通 常 是 一 个 元 组 (ipaddr,port) 
s.setsockopt(level, y 和 a 
pttnealey 设置 给 定 套 接 字 选项 的 值 
s.getsockopt(level, 返回 套 接 字 选项 的 什 
optname) 

设置 套 接 字 操 作 的 超时 时 间 , timeout 是 一 个 浮 点 数 , 单位 是 秒 。 其 值 为 None 
s.settimeout(timeout) 表示 没有 超时 时 间 。 一 般 情况 下 ， 超 时 时 间 应 该 在 刚 创 建 套 接 字 时 设置 ， 

因为 它们 可 能 用 于 连接 操作 (例如 connectO) 
s.gettimeout() 返回 当前 超时 时 间 的 值 ， 单 位 是 秒 ， 如 果 没 有 设置 超时 期 ， 则 返回 None 
s.fileno() 返回 套 接 字 的 文件 描述 符 
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函数 描述 
如 果 flag 为 0, 则 将 套 接 字 设 为 非 阻塞 模式 , 否则 将 套 接 字 设 为 阻塞 模式 ( 默 
s.setblocking(flag) 认 值 )。 在 非 阻 塞 模式 下 ， 如果 调 用 recv0 没 有 发 现任 何 数据 , 或 sendO 调 用 
无 法 立即 发 送 数 据 ， 那 么 将 引起 socket.error 异常 
s.makefile() 创建 一 个 与 该 套 接 字 相关 联 的 文件 


在 了 解 了 TCP/IP 协议 的 基本 概念 以 及 了 P 地址 、 端 口 的 概念 和 Socket 之 后 ， 就 可 以 开 


始 进 行 网 络 编程 了 。 


[ 圆 13-1 编写 一 个 简单 的 TCP 服务 器 程序 ， 它 接收 客户 端 连接 ， 把 客户 端 发 过 来 的 


字符 串 加 上 "Hello" 再 发 回去 。 


完整 的 TCP 服务 器 端 程序 如 下 : 
import socket # 导 入 socket 模块 
import threading # 导 入 threading 线程 模块 
def tcplink(sock, addr): 
print (' 接 收 一 个 来 自 $s:%s 连接 请 求 ' s addr) 
sock.send(b'Welcome!') # 发 给 客户 端 Welcome ! 信 息 
while True : 
data=sock. recv (1024) # 接 收 客户 端 发 来 的 信息 
time.sleep (1) # 延 时 1 秒 钟 
if not data or data.decode('utf-8')=—'exit': # 如 果 没 数据 或 收 到 “exit ”信息 
break # 终 止 循环 
sock.send(('Hello, %s!' % data.decode('utf-8')).encode('utf-8')) 
# 收 到 信息 加 上 Hello 发 回 
sock.close() # 关 闭 连 接 


Print (' 来 自 $s:%s 连接 关闭 了 .' % addr) 
5s=socket.socket (socket .AF INET, socket.SOCK STREAM) 
s.bind(('127.0.0.1', 8888)) # 监 听 本 机 8888 端口 
s.listen(5) # 连 接 的 最 大 数量 为 5 
print ( "等待 客户 端 连接 . ..') 


while True: 
sock, addr=s.accept () 间接 受 一 个 新 连接 


# 创 建新 线程 来 处 理 TCP 连接 
t=threading.Thread (target=tcplink, args=(sock, addr)) 
七 .Start () 


在 程序 中 首先 创建 一 个 基于 IPv4 和 TCP 协议 的 Socket: 


Ss=socket .socket (socket .AF INET， socket.SOCK STREAM) 


然后 绑 定 监听 的 地 址 和 端口 。 服 务 器 可 能 有 多 块 网 卡 ， 可 以 绑 定 到 某 一 块 网 卡 的 


地 址 上 ， 也 可 以 用 0.0.0.0 绑 定 到 所 有 的 网 络 地 址 ， 还 可 以 用 127.0.0.1 绑 定 到 本 机 地 址 。 
127.0.0.1 是 一 个 特殊 的 下 地 址 ， 表 示 本 机 地 址 ， 如 果 绑 定 到 这 个 地 址 ， 客 户 端 必须 同时 


本 机 运行 才能 连接 ， 也 就 是 说 ， 外 部 的 计算 机 无 法 连接 进来 。 
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IP 


在 
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。 注 意 ， 小 于 1024 的 端口 号 必须 要 有 管理 员 权 限 才 能 绑 定 。 


# 监 听 本 机 8888 端口 
Sbind((" i270.0-.1". 8888)7 


接着 调用 listen0 方 法 开始 监听 端口 ， 传 入 的 参数 指定 等 待 连接 的 最 大 数量 为 5: 


避 


s.listen(5) 
print (' 等 待 客户 端 连接 . . .') 
接 下 来 ， 服务器 程序 通过 一 个 无 限 循环 接受 来 自 客 户 端的 连接 ，accept(O 会 等 待 并 返回 
一 个 客户 端的 连接 。 
while True: 
# 接 受 一 个 新 连接 
sock，addr=s .accept ()#sock 是 新 建 的 Socket 对 象 ， 服 务 器 通过 它 与 对 应 客户 端 通 
# 信 ，addr 是 IP 地 址 
# 创 建新 线程 来 处 理 TCP 连接 
t=threading.Thread (target=tcplink, args=(sock, addr)) 
tstart(} 
每 个 连接 都 必须 创建 新 线程 (或 进程 ) 来 处 理 ， 否 则 单线 程 在 处 理 连 接 的 过 程 中 无 法 
接受 其 他 客户 端的 连接 : 
def tcplink(sock, addr): 
print (' 接 收 一 个 来 自 $s:%s 连接 请 求 '% addr) 


sock.send(b'Welcome!') # 发 给 客户 端 “*Welcome! ”信息 
while True: 
data=sock.recv (1024) # 接 收 客户 端 发 来 的 信息 
time.sleep (1) # 延 时 1 秒 钟 
if not data or data.decode ('utf-8') 一 'exit' :# 如 果 没 数据 或 收 到 'exit ' 信 息 
break # 终 止 循环 


sock.send(('Hello, %s!' % data.decode('utf-8')).encode('utf-8')) 
# 收 到 信息 加 上 “Hello” 发 回 
sock.close () # 关 闭 连接 
print (' 来 自 $s:%s 连接 关闭 了 .' % addr) 


在 连接 建立 后 ， 服 务 器 首先 发 一 条 欢迎 消息 ， 然 后 等 待 客户 端 数 据 ， 并 加 上 “Hello” 
再 发 送 给 客户 端 。 如 果 客户 端 发 送 了 exit 字符 串 ， 就 直接 关闭 连接 。 
如 果 要 测试 这 个 服务 器 程序 ， 还 需要 编写 一 个 客户 端 程序 : 


import socket # 导 入 socket 模块 
S=SOCket .socket (socket .AF INET， socket .SOCK STRERAM) 

s.connect (('127.0.0.1', 8888)) # 建 立 连接 

# 打 印 接收 到 欢迎 消息 


print (s.recv(1024) .decode ('utf-8')) 
for data in [b'Michael', b'Tracy', b'sSarah']: 
s.send(data) # 客 户 端 程序 发 送 人 名 数据 给 服务 器 端 


print (s.recv(1024) .decode ('utf-8')) 
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s.send(b'exit') 

s.close() 

J 开 两 个 命令 行 窗口 ， 一 个 是 运行 服务 器 端 程序 ， 另 一 个 是 运行 客户 端 程序 ， 就 可 以 
运行 效果 ， 如 图 13-4 和 图 13-5 所 示 。 


看 


[cl 


Fa, CNWindows\pyexe 


ER 目 127.9.9.1: 4758 


图 13-4 服务 器 程序 效果 


P, CAWindows\py.exe 


Melcome! 
»- Michael! 
» Tr 


» Sa 


图 13-5 客户 端 程序 效果 


需要 注意 的 是 ， 客 户 端 程序 运行 完毕 就 退出 了 ， 而 服务 器 程序 会 永远 运行 下 去 ， 必 须 

按 Ctrl+C 组 合 键 退出 程序 。 

可 见 ， 用 TCP 协议 进行 Socket 编程 在 Python 中 十 分 简单 ， 对 于 客户 端 ， 要 主动 连接 

服务 器 的 卫 和 指定 端口 ， 对 于 服务 器 ， 要 首 2 指定 端口 ， 然 后 对 每 一 个 新 的 连接 创建 

-个 线程 或 进程 来 处 理 。 通 常 ， 服 务 器 程序 会 无 限 运行 下 去 。 另 外 还 需 注 意 ， 同 一 个 端口 
被 一 个 Socket 绑 定 了 以 后 就 不 能 被 其 他 Socket 绑 定 了 。 


13.2.5 ”多 线程 编程 


线程 是 操作 系统 可 以 调度 的 最 小 执行 单位 ， 能 够 执行 并 发 处 理 。 通 常 是 将 程序 拆 分 成 
两 个 或 多 个 并 发 运行 的 线程 ， 即 同时 执行 多 个 操作 。 例 如 ， 在 使 用 线程 的 同时 监视 用 户 并 
发 输入 ， 并 执行 后 台 任务 等 。 

threading 模块 提供 了 Thread 类 来 创建 和 处 理 线程 ， 格 式 如 下 : 

线程 对 象 =threading.Thread (target= 线 程 函数 ,args=( 参 数列 表 )，name= 线 程 名 ， 

group= 线 程 组 ) 

第 一 个 参数 是 函数 名 ， 第 二 个 参数 args 是 一 个 元 组 ， 线 程 名 和 线程 组 都 可 以 省 略 。 

Thread 类 还 提供 了 以 下 方法 。 
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。 run(): 用 于 表示 线程 活动 的 方法 。 
start(): 启动 线程 活动 。 
。 join([time]): 可 以 阻塞 进程 ， 直 到 线程 执行 完毕 。 参 数 time 指定 超时 时 间 (单位 为 
秒 )， 超 过 指定 时 间 join 就 不 再 阻塞 进程 了 。 
。 isAlive0: 返回 线程 是 否 活动 。 
getName(): 返回 线程 名 。 
。 setName(): 设置 线程 名 。 
threading 模块 提供 的 其 他 方法 如 下 : 
。 threading.currentThread(): 返回 当前 的 线程 变量 。 
threading.enumerate(): 返回 一 个 包含 正在 运行 的 线程 的 list。 正 在 运行 指 线程 启动 
后 、 结 束 前 ， 不 包括 启动 前 和 终止 后 的 线程 。 
threading.activeCount(): 返回 正在 运行 的 线程 数量 , 与 len(threading.enumerate()) 有 相 
同 的 结果 。 
[ 贺 13-2 编写 自己 的 线程 类 myThread 来 创建 线程 对 象 。 
分 析 : 自己 的 线程 类 直接 从 threading.Thread 类 继承 ， 然 后 重 写 。 init 0 方法 和 run() 
方法 就 可 以 创建 线程 对 象 了 。 


import threading 
import time 
exitFlag=0 
class myThread (threading.Thread) : “## 继 承 父 类 threading.Thread 
def _ init _(self, threadID, name, counter): 
threading.Thread. _init _(self) 
self.threadID=threadID 
self.name=name 
self.counter=counter 
def run (self) :# 把 要 执行 的 代码 写 到 run () 函数 里 面 ， 线 程 在 创建 后 会 直接 运行 run () 函数 
print ("starting "+self.name) 
print time (self.name, self.counter, 5) 
print ("Exiting "+self.name) 
def print time (threadName, delay, counter): 
while counter: 
if exitFlag: 
thread.exit () 
time.sleep (delay) 
print ("%s: %s"%(threadName, time.ctime (time.time()))) 
counter-=1 
# 创 建新 线程 
threadl=myThread(1, "Thread-1", 1) 
thread2=myThread (2, "Thread-2", 2) 
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# 开 启 线程 

thread]l .start () 
thread2 .start () 
print ("Exiting Main Thread") 


以 上 程序 的 执行 结果 如 下 ; 
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Main Thread Starting Thread-2 


Starting Thread-1 Exiting 
Thread=1: ‘Tue Aug 2 10:19:01 
Thread-2: Tue Aug 2 10:19:02 
Thread-1: Tue Aug 2 10:19:02 
Thread-1: Tue Aug 2 10:19:03 
Thread-2: Tue Aug 2 10:19:04 
Thread-1: Tue Aug 2 10:19:04 
Thread-1: Tue Aug 2 10:19:05 
Exiting Thread-1 

Thread-2: Tue Aug 2 10:19:06 
Thread-2: Tue Aug 2 10:19:08 
Thread-2: Tue Aug 2 10:19:10 


Exiting Thread-2 


13.3 “在线 聊天 程序 设计 的 步骤 二 
在 线 聊 天 程序 的 服务 器 端 ey 


13.3.1 


在 服务 器 端 设 计 ServerUI 类 ， 
sendMessage(self)， 并 在 构造 函数 中 完成 Tkinter 界面 布局 。 

在 服务 器 端 建立 Socket 并 绑 定 5505 后 循环 接受 客户 端的 连接 请 求 。 当 服务 器 与 客户 
端的 连接 建立 后 ， 如 果 客 户 端 发 送 字 符 Y， 服 务 器 端 收 到 后 会 返回 字符 Y 信息 ， 表 明 连 接 
建立 成 功 。 在 连接 建立 成 功 后 即 可 不 断 接收 客户 端 发 来 的 聊天 信息 。 


下 面 是 月 


有 务 器 端 代码 : 


#Filename:ServerUI.py 


#Python 在 线 聊天 服务 器 端 


import 
import 
import 
import 


import 


tkinter 


tkinter.font as tkFont 


socket 
threading 
time, tsys 


class SerVerUI() : 
GECa3 一 270201 
Port=5505 


global serverSock; 
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flag=False 
# 初 始 化 类 的 相关 属性 的 构造 函数 
def init _(self): 


self.root=tkinter.Tk() 

self.root.title('Python 在 线 聊天 -服务 器 端 V1 .0') 

# 窗 口 面板 ， 用 4 个 frame 面板 布局 

self.frame=[tkinter.Frame (),tkinter.Frame (),tkinter.Frame (), 
tkinter.Frame ()] 

# 显 示 消 息 Text 右边 的 滚动 条 
self.chatTextScrollBar=tkinter.Scrollbar (self.frame[0]) 
self.chatTextScrollBar.pack (side=tkinter.RIGHT, fill=tkinter.Y) 
# 显 示 消 息 Text， 并 绑 定 上 面 的 滚动 条 

ft=tkFont.Font (family="'Fixdsys',size=11) 
self.chatText=tkinter.Listbox(self.frame[0],width=70,height=18, 
font=ft) 
self.chatText['yscrollcommand']=self.chatTextScrollBar.set 
self.chatText .pack (expand=1, fill=tkinter .BOTH) 
self.chatTextSscrollBar['command']=self.chatText.yview() 
self.frame[0] .pack (expand=1, fill=tkinter .BOTH) 

# 标 签 ， 分 开 消息 显示 Text 和 消息 输入 Text 

label=tkinter.Label (self.frame [1] ,height=2) 

label.pack (fill=tkinter .BOTH) 

self.frame[1] .pack (expand=1, fill=tkinter .BOTH) 

# 输 入 消息 Text 的 滚动 条 

self.inputTextScrollBar=tkinter.scrollbar (self.frame [2]) 
self.inputTextScrollBar.pack (side=tkinter .RIGHT, fill=tkinter.Y) 
# 输 入 消息 Text， 并 与 滚动 条 绑 定 

ft=tkFont .Font (family="'Fixdsys',size=11) 
self.inputText=tkinter.Text(self.frame[2],width=70,height=8, font=ft) 
self.inputText['yscrollcommand']=self.inputTextScrollBar.set 
self.inputText .pack (expand=1, fill=tkinter .BOTH) 
self.inputTextScrollBar['command']=self.chatText .yview() 
self.frame[2] .pack (expand=1, fill=tkinter .BOTH) 

# “发 送 ” 按钮 

self.sendButton=tkinter.Button (self.frame [3] ,text=" 发 送 ' ,width=10, 
command=self .sendMessage) 

self.sendButton.pack (expand=]1, side=tkinter.BOTTOM and tkinter 
-RIGHT, padx=25, pady=5) 

#“ 关 闭 ” 按 钮 

self.closeButton=tkinter.Button (self.frame[3], text=' 关 闭 ', width=10, command 
=self.close) 

self.closeButton.pack (expand=1, side=tkinter.RIGHT,padx=25, pady=5) 
self.frame[3] .pack (expand=1, fill=tkinter .BOTH) 
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# 接 收 消息 


def receiveMessage (self): 


# 建 立 Socket 连接 
self.serverSock=socket .socket (socket .AF INET,socket.SOCK STREAM) 
self.serverSock.bind( (self.local, self .port)) 
self.serverSock.listen (15) 
self.buffer=1024 
self.chatText .insert (tkinter.END, "服务 器 已 经 就 绪 . . . . . . 二 
# 循 环 接受 客户 端的 连接 请 求 
while True: 
self.connection, self.address=self.serverSock.accept () 
self.flag=True 
while True: 
# 接 收 客户 端 发 送 的 消息 
self.cientMsg=self .connection.recv (self.buffer) .decode ('utf-8') 
if not self.cientMsg: 
continue 
elif self.cientMsg=="'Y"': 
self.chatText.insert (tkinter.END, ' 服务器 端 已 经 与 客户 端 建立 


self.connection.send(b'Y') 
elif self.cientMsg=='N': 
self.chatText.insert (tkinter.END, ' 服务器 端 与 客户 端 建立 连接 


self.connection.send(b'N') 

SEse: 
theTime=time.strftime ("%Y-%m-%d %H:%M:%S", time.localtime ()) 
self.chatText.insert (tkinter.END, ' 客 户 端 ' + theTime +' 说 : \n') 
self.chatText.insert (tkinter.END, ' ' + self.cientMsg) 


# 发 送 消 息 
def sendMessage (self): 


# 得 到 用 户 在 Text 中 输入 的 消息 
message=self.inputText .get ('1.0',tkinter .END) 
# 格 式 化 当前 的 时 间 
theTime=time.strftime ("%Y-%m-%d %H:S$M:%S", time.localtime()) 
self.chatText .insert (tkinter.END, ' 服 务 器 '+theTime+' 说 : \n') 
self.chatText.insert (tkinter.END,' '+message+'\n') 
if self.flag==True: 
# 将 消息 发 送 到 客户 端 
self.connection.send (message-encode () ) 


Slse: 


#Socket 连接 没有 建立 ， 提 示 用 户 
self.chatText .insert (tkinter.END,' 您 还 未 与 客户 端 建立 连接 , 客户 端 无 法 
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收 到 您 的 消息 \n') 
# 清 空 用 户 在 Text 中 输入 的 消息 
self.inputText.delete(0.0,message. len _()-1.0) 
# 关 闭 消息 窗口 并 退出 
def close(self) : 
sys.exit () 
# 启 动 线程 接收 客户 端的 消息 
def startNewThread (self): 
# 启 动 一 个 新 线程 来 接收 客户 端的 消息 
#args 是 传递 给 线程 函数 的 参数 ，receiveMessage 函数 不 需要 参数 ， 只 传 一 个 空 元 组 
thread=threading.Thread (target=self.receiveMessage,args=()) 
thread.setDaemon (True); 
thread.start (); 
def main(): 
server=ServerUI () 
SerVer. startNewThread () 
server.root .mainloop () 
if _ name ==' main _': 


main() 


13.3.2 ”在 线 聊 天 程序 的 客户 端 


在 客户 端 设 计 ClientUI 类 ， 封 装 接收 消息 函数 方法 receiveMessage(selfj)、 发 送 消息 
sendMessage(selfj， 并 在 构造 函数 中 完成 Tkinter 界面 布局 。 

在 客户 端 建立 Socket 后 ， 向 服务 器 发 送 字 符 Y， 表示 客户 端 要 连接 服务 器 。 服 务 器 端 
收 到 后 会 返回 字符 YY 信息， 表明 连接 建立 成 功 。 在 连接 建立 成 功 后 即 可 不 断 接 收服 务 器 发 
来 的 聊天 信息 。 

下 面 是 客户 端 代码 : 

#Filename:ClientUI.py 

#Python 在 线 聊 天 客户 端 2016-2-12 


import tkinter 

import tkinter.font as tkFont 

import socket 

import threading 

import time,tsys 

class ClientUI() : 
Jocal="127 0 了 2 
port=5505 
global clientSsock; 
flag=False 
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# 初 始 化 类 的 相关 属性 的 构造 函数 

def init _(self): 
self.root=tkinter.Tk() 
self.root.title('Python 在 线 聊 天 -客户 端 V1.0') 
# 窗 口 面板 ， 用 4 个 面板 布局 
self.frame=[tkinter.Frame (),tkinter.Frame (),tkinter.Frame (), 
tkinter.Frame ()] 
# 以 下 界面 设计 与 服务 器 端 相同 
# 显 示 消 息 Text 右边 的 滚动 条 
self.chatTextScrollBar=tkinter.Scrollbar (self.frame[0]) 
self.chatTextScrollBar.pack (side=tkinter.RIGHT, fill=tkinter.Y) 
# 显 示 消息 Text， 并 绑 定 上 面 的 滚动 条 
ft=tkFont .Font (family="'Fixdsys',size=11) 
self.chatText=tkinter.Listbox(self.frame[0],width=70,height=18, font=ft) 
self.chatText['yscrollcommand']=self.chatTextScrollBar.set 
self.chatText .pack (expand=1, fill=tkinter .BOTH) 
self.chatTextSscrollBar['command']=self.chatText .yview () 
self.frame[0] .pack (expand=1, fill=tkinter .BOTH) 
# 标 签 ， 分 开 消息 显示 Text 和 消息 输入 Text 
label=tkinter.Label (self.frame [1] ,height=2) 
label.pack (fill=tkinter .BOTH) 
self.frame[1] .pack (expand=1, fill=tkinter .BOTH) 
# 输 入 消息 Text 的 滚动 条 
self.inputTextScrol1Bar=tkinter.Scrollbar (self.frame[2]) 
self.inputTextScrol1Bar.pack(side=tkinter.RIGHT,fil1=tkinter.Y) 
# 输 入 消息 Text， 并 与 滚动 条 绑 定 
ft=tkFont .Font (family="'Fixdsys',size=11) 
self.inputText=tkinter.Text (self.frame[2],width=70,height=8, font=ft) 
self.inputText['yscrollcommand']=self.inputTextScrollBar.set 
self.inputText .pack (expand=]1, fill=tkinter .BOTH) 
self.inputTextScrollBar['command']=self.chatText .yview() 
self.frame[2] .pack (expand=1, fill=tkinter .BOTH) 
#“ 发 送 ” 按 钮 
self.sendButton=tkinter.Button (self .frame[3], text=' 发 送 '， 
width=10,command=self .sendMessage) 
self.sendButton.pack (expand=1, side=tkinter.BOTTOM and tkinter 
-RIGHT, padx=15, pady=8) 
#“ 关 闭 ” 按 钮 
self.closeButton=tkinter.Button (self.frame[3], text=' 关 闭 ', width=10, 
command=self.close) 
self.closeButton.pack (expand=1, side=tkinter.RIGHT,padx=15, pady=8) 
self.frame[3] .pack (expand=1, fill=tkinter .BOTH) 
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# 接 收 消息 
def receiveMessage (self): 
try: 
# 建 立 Socket 连接 
self.clientSock=socket .socket (socket -AF INET, socket.SOCK STREAM) 
self.clientSock.connect ((self.local, self.port)) 
self.flag=True 
except: 
self.flag=False 


self .chatText .insert (tkinter .END, ' 您 还 未 与 服务 器 端 建立 连接 , 请 检查 服 
务 器 是 否 启动 ') 


return 
self.buffer=1024 


self.clientSock.send('Y' .encode () ) # 向 服务 器 发 送 字符 Y， 表 示 客 户 端 要 连接 服务 器 


while True : 
CE 

if self.flag==True: 
# 连 接 建 立 ， 接 收服 务 器 端 消息 
Self.serverMsg=self.clientSock.recv (self.buffer) 
.decode ('utf-8') 
if self.serverMsg=="'Y": 

self.chatText.insert (tkinter.END, ' 客户 端 已 经 与 服务 器 端 


elif self.serverMsg=="'N"': 
self.chatText.insert (tkinter.END, ' 客户 端 与 服务 器 端 建立 


elif not self.serverMsg: 
continue 

Eee 
theTime=time .strftime ("%Y-%Sm-%d SH:SM:%S", time 
.localtime ()) 


self.chatText.insert (tkinter.END, ' 服 务 器 端 ' + theTime 


+， 说 : \n') 
self.chatText .insert (tkinter.END, ' ' + self.serverMsg) 
else: 
break 


except EOFError as msg: 
raise msg 
self.clientSock-close() 


break 
# 发 送 消息 
def sendMessage (self): 
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砷 得 到 用 户 在 Text 中 输入 的 消息 

message=self.inputText .get ('1.0',tkinter .END) 

# 格 式 化 当前 的 时 间 

theTime=time.strftime ("%Y-%m-%d %H:%M:%S", time.localtime()) 
self.chatText.insert (tkinter.END, ' 客 户 端 器 ' + theTime +' 说 : \n') 


self.chatText.insert (tkinter.END,' ' + message + '\n') 
if self.flag==True: 

self.clientSock.send (message.encode ()); # 将 消息 发 送 到 服务 器 端 
发 下 本 本 和 


#Socket 连接 没有 建立 ， 提 示 用 户 
self.chatText .insert (tkinter .END, ' 您 还 未 与 服务 器 端 建立 连接 , 服务 器 端 
无 法 收 到 您 的 消息 \n') 
# 清 空 用 户 在 Text 中 输入 的 消息 
self.inputText.delete(0.0,message. len _()-1.0) 
# 关 闭 消息 窗口 并 退出 
def close(self) : 
sys.exit () 
# 启 动 线程 接收 服务 器 端的 消息 
def startNewThread (self) : 


# 启 动 一 个 新 线程 来 接收 服务 器 端的 消息 
#args 是 传递 给 线程 函数 的 参数 ，receiveMessage 函数 不 需要 参数 ， 只 传 一 个 空 元 组 


thread=threading.Thread (target=self.receiveMessage,args=()) 
thread.setDaemon (True); 
thread.start (); 


def main() : 


3 
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client=ClientUI() 
client.startNewThread () # 启 动 线程 接收 服务 器 端的 消息 


client.root.mainloop () 


__name =='_ main _': 


main() 


网 络 通 信和 案例 一 一 基于 
UDP 的 网 络 五 子 棋 游 戏 


14.1 网 络 五 子 棋 游 戏 简介 


五 子 棋 是 一 种 家 喻 户 晓 的 棋 类 游戏 ， 它 的 多 变 吸引 了 无 数 玩家 
是 一 简易 五 子 棋 ， 棋 盘 为 13x15， 黑 子 先 落 
和 


台 


利 


本 章 设 计 的 五 子 棋 游戏 


， 在 每 次 下 棋子 前 先 判断 该 处 有 无 棋子 ， 有 则 不 
沙子 ， 超 出 边界 不 能 落 子 。 任 何 一 方 有 达到 横向 、 竖 向 、 斜 向 、 反 斜 向 连 到 5 个 棋子 则 胜 


本 章 介 绍 基于 UDP 的 Socket 编程 方法 来 制作 网 络 五 子 棋 游 戏 程序 。 网 络 五 子 棋 游戏 


采用 C/S 架构 ， 分 为 服务 器 


端 和 客户 端 


服务 器 端 运 行 界面 如 医 


器 端 首先 启动 ， 当 客户 端 连接 后 服务 器 端 可 以 走 棋 


[7 REF 


EE we ea 


图 14-1 


网 络 五 子 棋 游戏 的 服务 器 端 界面 


14-1 所 示 ， 在 游戏 时 服务 


Pe 项 目 案例 开发 

从 入 门 到 实战 一 一 爬虫 、 游 戏 和 机 器 学 习 
用 户 根据 提示 信息 ， 轮 到 自己 下 棋 才 可 以 在 棋盘 上 落 子 ， 同 时 下 方 标签 会 显示 对 方 的 
走 棋 信息 ， 服 务 器 端 用 户 通过 “退出 游戏 ”按钮 结束 游戏 。 

客户 端 运行 界面 如 图 14-2 所 示 ， 需 要 输入 服务 器 的 瑟 地 址 〈 这 里 采用 默认 地 址 ， 即 
本 机 地 址 ), 如 果 正 确 且 服务 器 启动 则 可 以 连接 服务 器 。 连接 成 功 后 客户 端 用 户 根据 提示 信 
息 ， 轮 到 自己 下 棋 才 可 以 在 棋盘 上 落 子 ， 同 样 可 以 通过 “退出 游戏 ”按钮 结束 游戏 。 
| 


7_RHETtv20-UDpsrS | 


豆 户 泪 主 的 位 置 7,7 
进 3 允 | 


一 一 


图 14-2 ”网 络 五 子 棋 游戏 的 客户 端 界面 


14.2 五子 棋 游戏 的 设计 思想 


在 下 棋 过 程 中 ， 为 了 保存 所 下 过 棋子 的 信息 ， 使 用 列表 map。map[x][y] 存 储 棋盘 (x,y) 
处 棋子 的 信息 ， 如 果 为 0 代表 黑子 ， 为 1 代表 白 子 。 
游戏 运行 时 ， 在 鼠标 单 击 事件 中 判断 单 击 位 置 是 否 合法 ， 即 不 能 在 已 有 棋子 的 位 置 单 
ff， 也 不 能 超出 游戏 棋盘 边界 ， 如 果 合法 ， 则 将 此 位 置信 息 加 入 到 map 列表 和 back 列表 
于 悔 棋 )， 同 时 调用 checkWin(x,y) 判 断 游戏 的 输赢 。 

本 游戏 的 设计 关键 是 判断 输赢 的 算法 。 对 于 该 算法 的 具体 实现 ， 大 致 分 为 以 下 几 个 
Pp 分: 

(1) 判断 X=Y 轴 上 是 否 形成 五 子 连珠 。 

(2) 判断 X=-Y 轴 上 是 否 形 成 五 子 连珠 。 


=n 


一 


Ek 


(3) 判断 Y 轴 上 是 否 形成 五 子 连珠 。 
(4) 判断 义 轴 上 是 否 形成 五 子 连珠 。 
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以 上 4 种 情况 只 要 任何 一 种 成 立 ， 那 么 就 可 以 判断 输赢 。 
def win lose() : # 输 赢 判 断 
# 扫 描 整 个 棋盘 ， 判 断 是 否 连 成 5 颗 


a=str (turn) 


print ("a=",a) 


for i in range(0,11): #0~10 
# 判 断 x=Y 轴 上 是 否 形成 五 子 连珠 
for j in range(0,11): #0~10 


if map[i][j]==a and map[i+1] [j+1]==a and map[i+2] [j+2]==a and 
map[i+3] [j+3]==a and map[i+4] [j+4]==a:print ("X=Y 轴 上 形成 五 子 连珠 ") 
return True 


for i in range(4,15): #4~14 
# 判 断 x=-Y 轴 上 是 否 形成 五 子 连珠 
for j in range(0,11): #0~10 


if map[i][j]==a and map[i-1] [j+1]==a and map[i-2] [j+2]==a and 
map[i-3] [j+3]==a and map[i-4] [j+4]==a:print ("X=-Y 轴 上 形成 五 子 连珠 ") 
return True 


for i in range(0,15): #0~14 
# 判 断 Y 轴 上 是 否 形成 五 子 连珠 
for j in range(4,15): #44 ~14 


if map[i][j]==a and map[i][j-1]==a and map[i][j-2]==a and 
map[i] [j-3]==a and map[i] [j-4]==a:print ("Y 轴 上 形成 五 子 连 珠 ") 
return True 


for i in range(0,11): #0~10 
# 判 断 X 轴 上 是 否 形成 五 子 连珠 
for j in range(0,15) : #0~14 


if map[i][j]==a and map[i+1] [j]==a and map[i+2] [j]==a 
and map[i+3] [j]==a and map[i+4] [j]==a:print ("x 轴 上 形成 五 子 连珠 ") 
return True 


return False 


判断 输赢 实际 上 不 用 扫描 整个 棋盘 ， 如 果 能 得 到 刚 下 的 棋子 的 位 置 (x, y)， 就 不 用 扫描 
整个 棋盘 ， 而 仅仅 在 此 棋子 附近 的 横 、 竖 、 斜 方向 均 判 断 一 遍 即 可 。 

checkWin(x.y) 判 断 这 个 棋子 是 否 和 其 他 棋子 连 成 五 子 ， 即 判断 输赢 。 它 是 以 (x.y) 为 中 
心 通过 横向 、 纵 向 、 斜 方向 的 判断 来 统计 相同 颜色 的 棋子 个 数 。 

例如 以 水 平方 向 (横向 ) 的 判断 为 例 ， 以 (x, y) 为 中 心计 算 水 平方 向 上 的 棋子 数量 时 首 
先 向 右 最 多 4 个 位 置 ， 如 果 同 色 则 count 加 1， 然 后 向 左 最 多 4 个 位 置 ， 如 果 同 色 则 count 
加 1。 统 计 完 成 后 如 果 count >=5， 则 说 明 水 平方 向 连 成 五 子 。 其 他 方向 同 理 。 因 为 每 个 方 
向 判断 前 下 子 处 (x,y) 还 有 己方 一 个 ， 所 以 count 的 初始 值 为 1。 


def checkWin (x,y): 
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flag=False 

count=1 ”# 保 存 共有 相同 颜色 的 多 少 棋子 相连 

color=map[x] [Y] 

# 通 过 循环 来 做 棋子 相连 的 判断 

# 横 向 的 判断 

# 判 断 横向 是 否 有 5 个 棋子 相连 ， 特 点 是 纵 坐 标 相 同 ， 即 map [x] [y] 中 的 y 值 是 相同 

i=1 

while color==map[x+i] [y] : # 向 右 统计 
count=count+1 
i=i+1l 

i=1 

while color==map[x-i] [y] : # 向 左 统计 
count=count+1 
i=i+l 

if count>=5: 
flag=True 

# 纵 向 的 判断 

i2=1 

count2=1 

while color==map[x] [y+i2]: 
count2=count2+1 
i2=i2+1 

i2=1 

while color==map [x] [y-i2]: 
count2=count2+1 
i2=i2+1 

if count2>=5: 
flag=True 

# 斜 方向 的 判断 〈 右 上 + 左下 ) 

i3=1 

count3=1 

while color==map [x+i3] [y-i3]: 
count3=count3+1 
i3=i3+1 

i3=1 

while color==map [x-i3] [y+i3]: 
count3=count3+1 
i3=i3+1 

if count3>=5: 
flag=True 

# 斜 方向 的 判断 〈 右 下 + 左上 ) 


i4=1 
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count4=1 

while color==map [x+i4] [y+i4]: 
count4=count4+1 
i4=i4+1 

i4=1 

while color==map[x-i4] [y-i4]: 
count4=count4+1 
i4=i4+1 

if count4>=5: 
flag=True 

return flag 


在 本 程序 中 每 下 一 步 棋 子 ， 调 用 checkWin(x,y) 函数 判断 是 否 已 经 连 成 五 子 ， 如 果 返 
回 Trme， 则 说 明 已 经 连 成 五 子 ， 显 示 输赢 结果 对 话 框 。 


14.3 ”关键 技术 


14.3.1 UDP 编程 


TCP 是 建立 可 靠 连 接 ， 并 且 通 信 双 方 都 可 以 用 流 的 形式 发 送 数据 。 相 区 
对 于 TCP，UDP 则 是 面向 无 连接 的 协议 。 视频 讲解 
在 使 用 UDP 协议 时 不 需要 建立 连接 ， 只 需要 知道 对 方 的 他 地 址 和 端口 号 就 可 以 直接 
发 数据 包 ， 但 是 能 不 能 到 达 就 不 知道 了 。 虽 然 用 UDP 传输 数据 不 可 靠 ， 但 它 的 优点 是 和 
TCP 相 比 速度 快 ， 对 于 不 要 求 可 靠 到 达 的 数据 可 以 使 用 UDP 协议 。 
通过 UDP 协议 传输 数据 和 TCP 类 似 , 使 用 UDP 的 通信 双方 也 分 为 客户 端 和 服务 器 端 。 
图 14-3 所 示 为 无 连接 UDP 的 时 序 图 。 


服务 器 客户 机 
Socket() Socket() 
Bind() 
服务 请 求 1 
ReceiveFrom()| SendTo() 
服务 应 答 1 
SendTo() ReceiveFrom()| 
Close() Close() 


图 14-3 无 连接 UDP 的 时 序 图 
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从 入 门 到 实战 一 疏 虫 、 游 戏 和 机 器 学 习 
对 于 UDP C/S， 客 户 机 并 不 与 服务 器 建立 一 个 连接 ， 而 仅仅 调用 函数 SendTo0) 给 服务 


器 发 送 数据 报 。 类 似 地 , 服务 器 也 不 从 客户 端 接收 一 个 连接 , 只 是 调用 函数 ReceiveFrom()， 
等 待 从 客户 端 来 的 数据 。 通 常 ， 依 照 ReceiveFrom() 得 到 的 协议 地 址 以 及 数据 报 ， 服 务 器 就 
可 以 给 客户 送 一 个 应 答 。 


[ 贺 14-1 编写 一 个 简单 的 UDP 演示 下 棋 程序 。 服 务 器 端 把 UDP 客户 端 发 来 的 下 棋 


& 标 信息 (x,y) 显 示 出 来 ， 并 把 坐标 加 1 后 〈 模 拟 服务 器 端 下 棋 ) 再 发 给 UDP 客户 端 。 


服务 器 首先 需要 绑 定 8888 端口 : 

import socket # 导 入 socket 模块 
S=SOCket .socket (socket .AF INET, socket.SOCK DGRAM) 
s.bind(('127.0.0.1', 8888)) 间 绑 定 端口 


在 创建 Socket 时 , SOCK DGRAM 指定 了 这 个 Socket 的 类 型 是 UDP。 绑 定 端口 和 TCP 


一 样 ， 但 是 不 需要 调用 listen0 方 法 ， 而 是 直接 接收 来 自任 何 客户 端的 数据 : 


print('Bind UDP on 8888...') 
while True: 
# 接 收 数据 
data, addr=s.recvfrom(1024) 
print('Received from %s:%s.' gs addr) 
print('received:',data) 
p=data.decode ('utf-8') .split (","); #decode() 解 码 ， 将 字 节 串 转 换 成 字符 串 
zx=int (p[0]); 
y=int (p[1]); 
print (p[0] ,Pp[1]) 
pos=str (x+1)+", "+str (y+1) 间 模 拟 服务 器 端 下 棋 的 位 置 
s.sendto (pos .encode ('utf-8') ,addr) # 发 回 客户 端 


recvfrom() 方 法 返回 数据 和 客户 端的 地 址 与 端口 ， 这 样 服务 器 收 到 数据 后 直接 调 


sendto() 就 可 以 把 数据 用 UDP 发 给 客户 端 。 


在 客户 端 使 用 UDP 时 ， 首 先 创建 基于 UDP 的 Socket， 然 后 不 需要 调用 connect()， 直 


接 通 过 sendto0) 给 服务 器 发 数据 : 


import socket # 导 入 socket 模块 

S=SoOCket . socket (socket .AF INET, socket.SOCK DGRAM) 

x=input ("请 输入 x 坐标 ") 

y=input ("请 输入 y 坐标 ") 

data=str (x)+","+str (y) 

s.sendto(data.encode ('utf-8°'), ('127.0.0.1', 8888)) 
#encode () 编码 ， 将 字符 串 转换 成 传送 的 字 节 串 

# 接 收服 务 器 加 1 后 的 坐标 数据 

data?2, addr=s.recvfrom(1024) 

print ("接收 服务 器 加 1 后 坐标 数据 : "，data2.decode ('utf-8')) 
#decode () 解码 


s.close() 
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从 服务 器 接收 数据 仍然 调用 recvfrom() 方 法 。 
这 里 仍然 用 两 个 命令 行 分 别 启 动 服务 器 和 客户 端 测试 ， 运 行 效果 如 图 14-4 和 图 14-5 


Ei os (li 


8B.1:62893. 


= 本 4 


图 14-4 服务 器 程序 效果 


2 CAWindows\py, exe Ex 


图 14-5 客户 端 程序 效果 


上 面 模拟 了 服务 器 端 和 客户 端 两 方 下 棋 时 的 通信 过 程 ， 有 此 基础 可 以 实现 基于 UDP 
的 网 络 五 子 棋 游 戏 ， 真 正 开 发 出 实用 的 网 络 程序 。 


14.3.2” 自 定义 网 络 五 子 棋 游 戏 的 通信 协议 


网 络 五 子 棋 游戏 的 设计 难点 在 于 需要 与 对 方 通信 , 这 里 使 用 了 面向 非 连接 的 Socket 编 
程 。Socket 编程 用 于 开发 C/S 结构 程序 ， 在 这 类 应 用 中 ， 客 户 端 和 服务 器 端 通常 需要 先 建 
立 连接 ， 然 后 发 送 和 接收 数据 ， Me my 本 章 的 通信 采用 基于 UDP 的 
Socket 编程 实现 。 虽然 这 里 两 台 计 算 机 不 分 主 次 , 但 在 设计 时 假设 一 台 做 服务 器 端 ( 黑 方 )， 
等 待 其 他 人 加 入 。 当 ls gd a IP。 为 了 区 分 通信 中 传送 的 
是 “输赢 信息 ”“ 下 的 棋子 位 置信 息 ”“ 结 束 游戏 ”等 ， 在 发 送信 息 的 首部 加 上 标识 。 因 此 
定义 了 如 下 协议 : 

@ movel 下 的 棋子 位 置 坐标 (x,y) 

网 如 ,“movel7.4” 表 示 对 方 下 子 位 置 坐标 (7.4)。 

@ over| 哪 方 赢 的 信息 

例如 ,“over| 黑 方 你 赢 了 ”表示 黑 方 赢 了 。 
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从 入 门 到 实战 一 一 爬虫 、 游 戏 和 机 器 学 习 


©@ exitl 
表示 对 方 离开 了 ， 游 戏 结束 。 
@ joinl 

表示 连接 服务 器 。 


当然 ， 可 以 根据 程序 功能 增加 协议 ， 例 如 悔 棋 、 文 字 聊 天 等 协议 。 由 于 本 程序 没有 设 
计 “ 悔 棋 ” 和 “文字 聊天 ”功能 ， 所 以 没 定义 相应 的 协议 ， 读 者 可 以 自己 完善 程序 。 

在 程序 中 根据 接收 的 信息 (当然 都 是 字符 串 ) 通 过 字符 串 .split("|") 获 取消 息 类 型 (move、 
join、exit 或 者 over)， 从 中 区 分 出 “输赢 信息 over”“ 下 的 棋子 位 置信 息 move” 等 ， 代 码 
如 下 : 


def receiveMessage(): # 接 收 消息 函数 
global s 


while True: 

# 接 收 客户 端 发 送 的 消息 

global addr 

data, addr=s.recvfrom(1024) 

data=data.decode ('utf-8') 

a=data.split ("|") # 分 割 数据 

if not data: 
print('client has exited!') 
break 

elif al0]=="3oin™: # 连 接 服务 器 请 求 
print ('client 连接 服务 器 !') 
labell["text"]='client 连接 服务 器 成 功 ， 请 你 走 棋 ! ，' 

elif a[0]=="'exit': # 对 方 退 出 信息 
Print ('client 对 方 退出 !') 
labell["text"]='client 对 方 退出 ， 游 戏 结束 !' 

elif a[0]=='over': ## 对 方 赢 信息 
print ( "对方 赢 信息 !) 
labell["text"]=data-split("1") [0] 
showinfo (title=" 提 示 ",message=data.split("1") [1]) 

elif a[0]=='move': # 客 户 端 走 的 位 置信 息 ， 例 如 "move17,4" 
print('received:',data, 'from',addr) 
p=a[1] .split(",") 
x=int (p[0]); 
y=int (p[1]); 
print (p[0],p[1] 
labell["tezxt"]=" 客 户 端 走 的 位 置 "+p[0]+p[1] 
drawotherChess (x, y) # 画 对 方 棋子 

s.close() 


掌握 通信 协议 以 及 单机 版 五 子 棋 游戏 的 知识 之 后 就 可 以 开发 网 络 五 子 棋 游戏 了 。 
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14.4 网 络 五 子 棋 游 戏 程序 设计 的 步骤 


14.4.1 ”服务 器 端 程序 设计 的 步 又 oe 


@ 主 程序 

定义 含 两 个 棋子 图 片 的 列表 imgs, 创建 Window 窗口 对 象 root, 初始 化 游戏 地 图 map， 
绘制 15x15 的 游戏 棋盘 ， 添 加 显示 提示 信息 的 标签 Label， 绑 定 Canvas 的 鼠标 和 按钮 左 键 
友人 件 。 
同时 创建 UDP 通信 服务 器 端的 SOCKET， 绑 定 在 8000 端口 ， 启 动 线程 接收 客户 端的 
肖 息 ， 最 后 的 root.mainloop() 方 法 是 进入 窗口 的 主 循环 ， 也 就 是 显示 窗口 。 


ee 


from tkinter import * 

from tkinter.messagebox import * 
import socket 

import threading 

import os 


root=TKk () 

Foot .title ("网 络 五 子 棋 V2 . 0 一 服务 器 端 ") 

# 五 子 棋 一 一 夏 敏 捷 2016-2-11 

imgs=[PhotoImage (file='D:\\python\\bmp\\Blackstone.gif'), 
PhotoImage (file='D:\\python\\bmp\\Whitestone.gif')] 


turn=0 # 轮 到 哪 方 走 棋 ，0 是 黑 方 ，1 是 白 方 
Myturn=-1 # 保 存 自己 的 角色 ，-1 表示 还 没 确定 下 来 
map=[[" mr mn nn nn fory 


in range(15)] 
cv=Canvas (root, bg='green', width=610, height=610) 


drawQiPan () # 绘 制 15x15 的 游戏 棋盘 
cv.bind("<Button-1>", callpos) 

cv.pack() 

labell=Label (root, text=" 服 务 器 端 . . .") # 显 示 提 示 信 息 

labell .pack() 

button1=Button (root, text=" 退 出 游戏 ") # 按 钮 


buttonl.bind("<Button-1>", callexit) 

buttonl .pack() 

# 创 建 UDP SOCKET 

S=SOCket .socket (socket .AF INET,socket.SOCK DGRAM) 
s.bind(('localhost',8000)) 

addr=("'localhost",8000) 

startNewThread () # 启 动 线程 接收 客户 端的 消息 
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从 入 门 到 实战 一 一 看 虫 、 游 戏 和 机 器 学 习 


receiveMessage(); 


root -mainloop () 


@ 退出 函数 


“退出 游戏 ”按钮 单 避 
os. exit(0) 结 束 程序 。 


def callexit (event): # 退 出 


pos="exit|" 


sendMessage (pos) 
os. exit (0) 


全 走 棋 函 数 


在 鼠标 单 击 导 


纯 
Hr 


同时 由 于 是 


也 不 能 超出 游戏 棋盘 边界 ， 如 果 合 法 ， 则 将 此 位 置信 息 记 录 到 map 列表 (数组 ) 上 
网 络 对 战 ， 第 一 次 走 棋 时 还 要 确定 自己 的 角色 (是 白 方 还 是 黑 方 )， 而 且 


要 判断 是 否 轮 到 自己 走 棋 。 这 里 使 用 两 个 变量 Mytum、turn 来 解决 。 
Myturn=-1 # 保 存 自 己 的 角色 
Mytum 是 -1 表示 还 没 确定 下 来 ， 在 第 一 次 走 棋 时 修改 。 
tum 保存 轮 到 谁 走 棋 ， 如 果 tum 是 0 表示 轮 到 黑 方 ，tum 是 1 表示 轮 到 白 方 。 
最 后 是 本 游戏 的 关键 一 一 输赢 判断 。 在 程序 中 调用 win_loseO 函 数 判断 输赢 ， 判 断 在 4 


种 情况 下 是 否 连 成 五 子 ， 返 回 True 或 False。 根 据 当前 走 棋 方 turn 的 值 (0 为 黑 方 ，1 为 白 


方 ) 得 出 谁 赢 。 
自己 走 完 后 轮 到 对 方 走 棋 。 


def callpos (event) : # 走 棋 
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global turn 
global Myturn 
if Myturn==-1: # 第 一 次 确定 自己 的 角色 (是 白 方 还 是 黑 方 ) 
Myturn=turn 
else: 
if (Myturn!=turn): 
showinfo (title=" 提 示 ",message=" 还 没 轮 到 自己 走 棋 ") 


return 
#print ("clicked at", event.x, event.y, turn) 
x= (event .x)//40 # 换 算 棋盘 坐标 


y=(event.y)//40 
brint("clicked RE x7 Ye turny 
if map[x] [Y] !=" "™: 
showinfo (title=" 提 示 ",message=" 已 有 棋子 ") 
else: 
imgl=imgs [turn] 
cv.create image ((x*40+20,y*40+20),image=img1) # 画 自己 的 棋子 
cv.pack() 


和 件 中 完成 走 棋 功 能 ， 判 断 单 击 位置 是 否 合法 ， 既 不 能 在 已 有 棋 的 位 置身 


fi 事件 的 代码 很 简单 ， 仅 仅 发 送 一 个 "exitI" 命 令 协议 消息 ， 最 后 调 


低 


日 
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map[x] [y]=str (turn) 
pos=str (x)+", "+str (y) 
sendMessage ("move|"+pos) 
print ("服务 器 走 的 位 置 ", pos) 
labell["tezxt"]=" 服 务 器 走 的 位 置 "+pos 
# 输 出 输赢 信息 
if win lose()==True: 
if turn==0: 
showinfo (title=" 提 示 ",message=" 黑 方 你 赢 了 ") 
sendMessage ("over1| 黑 方 你 赢 了 ") 
lses 
showinfo (title=" 提 示 ",message=" 白 方 你 赢 了 ") 
sendMessage ("over | 白 方 你 赢 了 ") 
# 换 下 一 方 走 棋 


if turn==0: 


turn=1 
Le 
turn=0 
@ 面 对 方 棋子 
当 轮 到 对 方 走 棋子 后 ， 在 自己 的 棋盘 上 根据 tum 知道 对 方 角色 ， 从 socket 获取 对 方 走 
棋 坐 标 (x,y)， 从 而 画 出 对 方 棋子 。 在 画 出 对 方 棋子 后 ， 同 样 换 下 一 方 走 棋 。 
def drawotherChess (x, y): # 画 对 方 棋子 
global turn 
imgl=imgs [turn] 
cv.create image ((x*40+20,y*40+20),image=img1) 
cv.pack() 
map[x] [y]=str (turn) 
# 换 下 一 方 走 棋 


if turn==0: 


turn=1 
elSe: 
turn=0 
全 画 械 盘 
drawQiPan() 画 15x15 的 五 子 棋 棋 盘 。 
def drawQipan(): # 画 棋盘 


for i in range(0,15): 

cv.create line(20,20+40*i,580,20+40*i,width=2) 
for i in range(0,15): 

cv.create line(20+40*i,20,20+40*i,580,width=2) 
cv.pack() 
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on 项 目 案例 开发 
从 入 门 到 实战 一 一 怜 虫 、 游 戏 和 机 器 学 习 


@ 输赢 判断 
win_lose() 从 4 个 方向 扫描 整个 棋盘 ， 判 断 是 否 连 成 5 子 。 
def win lose() : # 输 赢 判 断 


塌 扫 描 整个 棋盘 ， 判 断 是 否 连 成 5 子 
a=str (turn) 
print ("a=",a) 
for i in range(0,11): #0~10 
# 判 断 x=Y 轴 上 是 否 形成 五 子 连珠 
for j in range(0,11): #0~10 
if map[i][j]==a and map[i+1] [j+1]==a and map[i+2] [j+2]==a and 
map [i+3] [j+3]==a and map [i+4] [j+4]==a:print ("X=Y 轴 上 形成 五 子 连珠 ") 
return True 
for i in range(4,15): #4~14 
# 判 断 x=-Y 轴 上 是 否 形成 五 子 连 珠 
for j in range(0,11): #0~10 
if map[i][j]==a and map[i-1] [j+1]==a and map[i-2] [j+2]==a and 
map[i-3] [j+3]==a and map[i-4] [j+4]==a:print ("X=-Y 轴 上 形成 五 子 连珠 ") 
return True 
for i in range(0,15): #0~14 
# 判 断 Y 轴 上 是 否 形成 五 子 连珠 
for j in range(4,15): #4~14 
if map[i][j]==a and map[i][j-1]==a and map[i][j-2]==a and 
map [i] [j-3]==a and map[i] [j-4]==a:print ("Y 轴 上 形成 五 子 连珠 ") 
return True 
for i in range(0,11) : #0~10 
# 判 断 X 轴 上 是 否 形成 五 子 连珠 
for j in range(0,15): #0~14 
if map[i][j]==a and map[i+1] [j]==a and map[i+2] [j]==a and 
map[i+3] [j]==a and map[i+4] [j]==a:print ("x 轴 上 形成 五 子 连珠 ") 
return True 


return False 


@ 输出 map 地 图 
这 里 主要 是 显示 当前 棋子 信息 。 
def print map() : # 输 出 map 地 图 
for j in range(0,15) : #0~14 
for i in range (0,15) : #0 一 14 


print (map[i] [j],end="' ') 
print('w') 


人 @ 接收 消息 
本 程序 的 关键 部 分 就 是 接收 消息 data， 从 data 字符 串 .split("|) 中 分 割 出 消息 类 型 


| 274 


第 14 章 网络 通信 案例 一 一 基于 UDP 的 网 络 五 子 棋 游 戏 1 4 


(move、join、exit 或 者 over)。 如 果 为 join'， 是 客户 端 连接 服务 器 请 求 ; 如 果 为 'exit， 是 对 
方 客户 端 退出 信息 ;如 果 为 ' move '， 是 客户 端 走 的 位 置信 息 ; 如 果 为 ' over '， 是 对 方 客户 
端 赢 的 信息 。 这 里 重点 处 理 对 方 的 走 棋 信息 ， 例 如 “movel7,4”， 通 过 字符 串 .split(",") 分 割 
出 (x,y) 坐 标 。 


def receiveMessage () 时 
global s 
while True: 

# 接 收 客户 端 发 送 的 消息 

global addr 

data, addr=s.recvfrom(1024) 

data=data.decode ('utf-8') 

a=data.split ("|") # 分 割 数据 

if not data: 
print('client has exited!') 
break 

es uol= on # 连 接 服务 器 请 求 
print ('client 连接 服务 器 !') 
labell["text"]='client 连接 服务 器 成 功 ， 请 你 走 棋 ! " 

elif a[0]=='exit' : # 对 方 退出 信息 
Print ('client 对 方 退出 !') 
labell["text"]='client 对 方 退出 ， 游 戏 结束 ! " 

elif a[0]=='over': # 对 方 赢 信息 
print ('" 对 方 赢 信息 !) 
labell["text"]=data.split ("|") [0] 
showinfo (title=" 提 示 ",message=data.split ("|") [1]) 

elif a[0]=='move': # 客 户 端 走 的 位 置信 息 "move17, 4" 
print('received:',data, 'from',addr) 
p=a[1] .split(",") 
x=int (p[0]); 
y=int (p[1]); 
print (p[0] ,Pp[1]) 
labell["text"]=" 客 户 端 走 的 位 置 "+p[0]+p[1] 
drawotherChess (x, y) # 画 对 方 棋子 


s.close() 
发 送 消息 
发 送 消息 的 代码 很 简单 ， 调 用 Socket 的 sendto() 函 数 就 可 以 把 按 协 议 写 的 字符 串 作 
发 出 。 
def sendMessage (pos): # 发 送 消息 


global s 
global addr 


mk 
证 
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| 光 项 目 案例 开发 
从 入 门 到 实战 一 一 爬虫 、 游 戏 和 机 器 学 习 


5.sendto (pos -encode () ,addr) 


@@ 启动 线程 接收 客户 端的 消息 


启动 线程 接收 客户 端的 消息 

def startNewThread () : 
# 启 动 一 个 新 线程 来 接收 客户 器 端的 消息 
#thread. start new thread(function,args[,Kkwargs]) 
# 其 中 ，function 参数 是 将 要 调用 的 线程 函数 ，args 是 传递 给 线程 函数 的 参数 ， 它 必须 
# 是 元 组 类 型 ， 而 kwargs 是 可 选 的 参数 
#receiveMessage 函数 不 需要 参数 ， 只 传 一 个 空 元 组 
thread=threading.Thread (target=receiveMessage,args=()) 
thread.setDaemon (True); 


thread.start (); 
至 此 完成 服务 器 端 程序 设计 。 图 14-6 所 示 为 服务 器 端 走 棋 过 程 中 打印 的 输出 信息 。 网 
络 五 子 棋 的 客户 端 程序 设计 基本 上 与 服务 器 端 相似 ， 主 要 区 别 在 消息 处 理 上 。 


Yo CAWindows\py.exe 和 本 sey "| 


client 1 


» 49358> 


10 fron 《127.0.0.1’, 49358> 


9 fron 《’127.0.0.1’,. 49358> 


图 14-6 走 棋 过 程 中 打印 的 输出 信息 


14.4.2 ”客户 端 程序 设计 的 步骤 


@ 主 程序 
定义 含 两 个 棋子 图 片 的 列表 imgs, 创建 Window 窗口 对 象 root, 初始 化 游戏 地 图 map， 
绘制 15x15 的 游戏 棋盘 ， 添 加 显示 提示 信息 的 标签 Label， 绑 定 Canvas 的 鼠标 和 按钮 左 键 
单 击 事件 。 
同时 创建 UDP 通信 客户 端的 SOCKET， 这 里 不 指定 端口 ， 会 自动 绑 定 某 个 空闲 端 
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于 是 客户 端 SOCKET， 需 要 指定 服务 器 端的 他 和 端口 号 ， 并 发 出 连接 服务 器 端 请 求 。 
启动 线程 接收 服务 器 端的 消息 ， 最 后 的 rootmainloop() 方 法 是 进入 窗口 的 主 循环 ， 也 
就 是 显示 窗口 。 


from tkinter import * 

from tkinter.messagebox import * 

import socket 

import threading 

import os 

root=Tk () 

Foot .title ("网 络 五 子 棋 V2 . 0 一 UDP 客户 端 ") 

imgs=[PhotoImage (file='D:\\python\\bmp\\Blackstone.gif'), 
PhotoImage (file='D:\\python\\bmp\\Whitestone.gif')] 
turn=0 

Myturn=-1 

i ga) Ye hl de ees eg eh ss 
range (15)] 

cv=Canvas (root, bg='green', width = 610, height = 610) 
drawQiPan () 

cv.bind("<Button-1>", callback) 

cv.pack() 

labell=Label (root, text=" 客 户 端 . . .") 

labell .pack () 

puttonl=Button (root, text=" 退 出 游戏 ") 
buttonl.bind("<Button-1>", callexit) 

button]l .pack () 

# 创 建 UDP SOCKET 

Ss=socket .socket (socket .AF INET, socket.SOCK DGRAM) 


port=8000 # 服 务 器 端口 
host='localhost'" # 服 务 器 地 址 192.168.0.101 
pos="'join|’ ## “连接 服 务 器 ”命令 
sendMessage (pos); # 发 送 连接 服务 器 请 求 
startNewThread () # 启 动 线程 接收 服务 器 端的 消息 


FeceiveMessage () 
Foot .mainloop () 


四 退出 函数 
“退出 游戏 ”按钮 单 击 事件 的 代码 很 简单 ， 仅 仅 发 送 一 个 "exit" 命 令 协 议 消息 ， 最 后 调 
os. exit(0) 结 束 程 序 。 


def callexit (event): # 退 出 


pos="exit|" 
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| 六 本 项 目 案例 开发 
从 入 门 到 实战 一 一 爬虫 、 游 戏 和 机 器 学 习 


sendMessage (pos) 


os. exit (0) 
@ 走 棋 函 数 
其 功能 与 服务 器 端 相 同 ， 仅 仅 是 提示 信息 不 同 。 


def callback (event) : # 走 棋 
global turn 


global Myturn 
if Myturn==-1: # 第 一 次 确定 自己 的 角色 是 白 方 还 是 黑 方 ) 
Myturn=turn 
else: 
if (Myturn!=turn): 
showinfo (title=" 提 示 ",message=" 还 没 轮 到 自己 走 棋 ") 
return 
#print ("clicked at", event.x, event.y, turn) 
x= (event .x)//40 # 换 算 棋 盘 坐标 
y=(event.y)//40 
print("clicked at™”, x; YY turn) 
if map[x] [y] !=" ": 
showinfo (title=" 提 示 ",message=" 已 有 棋子 ") 
else: 
imgl=imgs [turn] 
cv.create image ((x*40+20,y*40+20),image=img1) 
cv.pack() 
map[x] [y]=str (turn) 
pos=str (x)+", "+str (y) 
sendMessage ("move|"+pos) 
print ("客户 端 走 的 位 置 ", pos) 
labell["text"]=" 客 户 端 走 的 位 置 "+pos 
# 输 出 输赢 信息 
if win lose()==True: 
if turn==0: 
showinfo (title=" 提 示 ",message=" 黑 方 你 赢 了 ") 
sendMessage ("over1| 黑 方 你 赢 了 ") 
else: 
showinfo (title=" 提 示 ", message=" 白 方 你 赢 了 ") 
sendMessage ("over | 白 方 你 赢 了 ") 
# 换 下 一 方 走 棋 
if turn==0: 
turn=1 
elLses 


turn=0 
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@ 画 械 盘 
drawQiPan() 画 15x15 的 五 子 棋 棋盘 。 
def drawQiPan(): # 画 棋盘 


for i in range(0,15): 

cv.create line(20,20+40*i,580,20+40*i,width=2) 
for i in range(0,15): 

Cv.create line(20+40*i,20,20+40*i,580,width=2) 
cv.pack() 


@ 输赢 判断 

win_lose() 从 4 个 方向 扫描 整个 棋盘 ， 判 断 是 否 连 成 五 子 。 其 功能 与 服务 器 端 相 同 ， 代 
码 没有 区 别 ， 因 此 将 代码 省 略 了 。 

@ 接收 消息 

接收 消息 data, 从 data 字符 串 .split("|") 中 分 割 出 消息 类 型 (move、 join 、exit 或 者 over)。 
其 功能 与 服务 器 端 没 有 区 别 ， 仅 仅 是 没有 'join' 消 息 类 型 ， 因 为 客户 端 连接 服务 器 ， 而 服务 
器 不 会 连接 客户 端 ， 所 以 少 了 一 个 join' 消 息 类 型 判断 。 

def receiveMessage() : # 接 收 消息 

global s 


while True: 
data=s.recv (1024) .decode ('utf-8') 
a=data.split ("|") # 分 割 数据 
if not data: 
print('server has exited!') 
break 
elif a[l0]=="'exit': # 对 方 退 出 信息 
print (' 对 方 退出 !') 
labell["text"]=' 对 方 退 出 ， 游 戏 结束 !，' 
elif a[0]=="over' : # 对 方 赢 信息 
print (' 对 方 赢 信 息 !') 
labell["text"]=data.split ("|") [0] 
showinfo (title=" 提 示 ",message=data.split ("1") [1]) 
elif a[0]=='"move' : # 服 务 器 端 走 的 位 置信 息 
Print('"received:' data) 
p=a[1].split("，”) 
x=int (p[0]); 
v antlLIE 
print (p[0],p[1]) 
labell["text"]=" 服 务 器 端 走 的 位 置 "+p[0]+p[1] 
drawotherChess (x, y) # 画 对 方 棋子 ， 函 数 代码 同 服务 器 端 


s.close() 


@ 发 送 消 息 
发 送 消 息 的 代码 很 简单 ， 仅 仅 调用 Socket 的 sendto0 函 数 ， 就 可 以 把 按 协议 写 的 字符 
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串 信 息 发 出 。 


def sendMessage (pos) : # 发 送 消息 
global s 


5.sendto (pos.encode(), (host,port)) 
人 @ 启动 线程 接收 服务 器 端的 消息 


# 启 动 线程 接收 服务 器 端的 消息 
def startNewThread(): 
# 启 动 一 个 新 线程 来 接收 服务 器 端的 消息 
#thread.start new thread (function,args[,kwargs]) 
# 其 中 ，function 参数 是 将 要 调用 的 线程 函数 ，args 是 传递 给 线程 函数 的 参数 ， 它 必须 
# 是 元 组 类 型 ， 而 kwargs 是 可 选 的 参数 
#receiveMessage 函数 不 需要 参数 ， 只 传 一 个 空 元 组 
thread=threading.Thread (target=receiveMessage,args=()) 
thread.setDaemon (True); 
thread.start (); 


至 此 完成 客户 端 程序 设计 。 
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中 国 象棋 和 五 子 棋 一 样 ， 也 是 一 种 家 喻 户 晓 的 棋 类 游戏 ， 它 的 多 变 吸引 了 无 数 玩家 。 
在 信息 化 的 今天 ， 再 用 纸 棋盘 、 木 棋子 下 象棋 有 点 太 落 伍 ， 能 否 来 点 革新 ， 把 古老 的 象棋 


请 进 计算 机 呢 ? 本 章 介绍 制作 “中 国 象棋 ”游戏 的 原理 和 过 程 。 


15.1 中国 象棋 介绍 


棋子 活动 的 场所 叫 作 “棋盘 ”， 在 长 方形 的 平面 上 ，9 条 平行 的 竖 线 和 ”视频 讲解 
10 条 平行 的 横 线 相交 ， 共 90 个 交叉 点 ， 棋 子 就 摆 在 这 些 交叉 点 上 。 其 中 的 第 5、 第 6 两 横 
线 之 间 未 画 竖 线 的 空白 地 带 称 为 “ 河 界 ”， 整 个 棋盘 以 “ 河 界 ” 分 为 相等 的 两 部 分 ; 两 方 将 
帅 坐 镇 、 画 有 “ 米 ” 字 方 格 的 地 方 叫 作 “ 九 宫 ”。 

@ 棋子 

象棋 的 棋子 共 32 个 ， 分 为 红 、 黑 两 组 ， 各 16 个 ， 由 对 弈 双方 各 执 一 组 ， 每 组 兵种 是 
一 样 的 ， 各 分 为 7 种 。 

。 红 方 : 帅 、 仕 、 相 、 车 、 马 、 炮 、 兵 。 

。 黑 方 : 将 、 士 、 象 、 车 、 马 、 炮 、 卒 。 
其 中 ， 帅 与 将 、 仕 与 士 、 相 与 象 、 兵 与 卒 的 作用 完全 相同 ， 仅 仅 是 为 了 区 分 红 棋 和 黑 棋 。 

@ 各 棋子 的 走 法 说 明 

1) 帅 与 将 

移动 范围 ， 只 能 在 王宫 内 移动 。 

移动 规则 : 每 一 步 只 可 以 水 平 或 垂直 移动 一 点 。 

2) 仕 与 十 

移动 范围 ; 只 能 在 王宫 内 移动 。 

移动 规则 : 每 一 步 只 可 以 沿 对 角 线 方向 移动 一 点 。 


| 的 要 项 目 案例 开发 

从 入 门 到 实战 一 一 爬虫 、 游 戏 和 机 器 学 习 

3) 相 与 象 

移动 范围 : 河 界 的 一 侧 。 

移动 规则 : 每 一 步 只 可 以 沿 对 角 线 方向 移动 两 点 ， 另 外 ， 在 移动 的 过 程 中 不 能 够 穿越 


移动 范围 : 任何 位 置 。 
移动 规则 : 每 一 步 只 可 以 水 平 或 垂直 移动 一 点 ， 再 按 对 角 线 方向 向 左 或 者 向 右 斜 着 移 
动 一 点 ， 俗 称 “ 马 走 日 "。 另外， 在 移动 的 过 程 中 不 能 够 穿越 障碍 。 


移动 范围 : 任何 位 置 。 
移动 规则 :可 以 在 水 平 或 垂直 方向 移动 任意 个 无 阻碍 的 点 。 


移动 范围 : 任何 位 置 。 
移动 规则 :移动 起 来 和 车 很 相似 ， 但 它 必须 跳 过 一 个 棋子 去 吃 掉 对 方 的 一 个 棋子 。 


移动 范围 ; 任何 位 置 。 

移动 规则 : 每 一 步 只 能 向 前 移动 一 点 。 过 河 以 后 ， 它 便 增 加 了 向 左 / 右 移动 的 能 力 ， 兵 
不 允许 向 后 移动 。 

@ 关于 胜 、 负 、 和 

在 对 局 中 ， 若 出 现下 列 情 况 之 一 ， 本 方 输 ， 对 方 赢 : 

(1) 己方 的 帅 〈 将 ) 被 对 方 棋子 吃 掉 。 

(2) 己方 发 出 认输 请 求 。 

(3) 己方 走 棋 超 出 步 时 限制 。 


15.2 ”关键 技术 


@ 移动 指定 图 形 对 象 
使 用 move0 方 法 可 以 修改 图 形 对 象 ( 例 如 一 个 棋子 ) 的 坐标 ， 具 体 语 法 如 下 : 


Canvas 对 象 .move (图 形 对 象 ,x 坐标 偏 移 量 , y 坐标 偏 移 量 ) 
例如 移动 “ 帅 ” 棋 子 图 片 向 右 150 像素 、 向 下 150 像素 ， 从 和 矩 形 左上 角 移 到 右 下 角 。 


from tkinter import * 


def callback() : # 事 件 处 理 函 数 
cv.move (rt1,150,150) # 移 动 rt1 

root=Tk () 

root .title(' 移 动 " 帅 "棋子 ') # 设 置 窗口 标题 


# 创 建 一 个 canvas， 设 置 其 背景 色 为 白色 
cv=Canvas (root, bg='white', width=260, height=220) 
imgl=PhotoImage (file=' 红 帅 .png') 
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cv.create rectangle(40,40,190,190,outline='red',fill="'green') 
rtl=cv.create image((40,40),image=img1) 才 绘 制 " 帅 "棋子 图 片 


cv.pack() 


button1=Button (root, text=" 移 动 棋子 ", command=callback, fg="red") 


button]l .pack () 
root .mainloop() 


为 了 对 比 移动 图 形 对 象 的 效果 , 程序 在 (40.40,190,190) 位 置 绘制 了 一 个 矩形 (由 绿色 填 
充 )， 单 击 “ 移 动 棋子 ”按钮 后 ,“ 帅 ”棋子 rtl 通过 move() 方 法 移动 到 矩形 右 下 角 ， 出 现 


图 


15-1 所 示 的 效果 。 


人 @ 删除 指定 图 形 对 象 


图 15-1 移动 “ 帅 ” 棋 子 图 形 对 象 


使 用 delete( 方 法 可 以 删除 图 形 对 象 〈 例 如 选中 棋子 的 提示 框 )， 有 具体 语法 如 下 : 
Canvas 对 象 .delete (图 形 对 象 ) 
将 前 面 例子 中 的 最 后 一 行 改 成 如 下 5 行 : 


def callback2 () : 
cV.delete (rt1) 


# 事 件 处 理 函 数 
# 删 除 rt1l 


button2=Button (root, text=" 删 除 棋子 ", command=callback2, fg="red") 


button2.pack() 
root .mainloop () 


单 击 “ 删 除 棋子 ”按钮 ,，“ 帅 ”棋子 消失 ， 出 现 如 图 15-2 所 示 的 效果 。 


六 移动 " 凡 ” 模子 


Fee VE 


图 15-2 ”删除 指定 图 形 对 象 
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15.3 中国 象 棋 的 设计 思路 


@ 棋盘 的 表示 

棋盘 的 表示 就 是 使 用 一 种 数据 结构 来 描述 棋盘 及 棋盘 上 的 棋子 ， 这 里 使 用 一 个 二 维 列 
表 chessmap 来 表示 。 一 个 典型 的 中 国 象棋 棋盘 使 用 9x10 的 二 维 列表 (数组 ) 来 表示 ， 每 
一 个 元 素 代表 棋盘 上 的 一 个 交点 ， 一 个 没有 棋子 的 交点 所 对 应 的 元 素 是 -1。 一 个 二 维 列表 
(数组 ) chessmap 保存 了 当前 棋盘 的 布局 。 当 chessmap[x][y]=i 时 说 明 (x,y) 处 是 棋子 图 像 i， 
否则 chessmap[x][y]=-1， 表 示 此 处 为 空 〈( 无 棋子 )。 

该 程序 中 下 棋 的 棋盘 界面 通过 DrawBoard() 函 数 在 Canvas 对 象 cv 上 夯 出 

imgl=PhotoImage (file='D:\\python\\bmp\\ 棋 盘 .png') 

def DrawBoard(): # 画 棋盘 


pl=cv.create image((0,0) ,image=imgl) 


cv.coords (p1, (360, 400)) # 指 定 棋 盘 图 像 的 中 心 点 坐标 为 (360, 400) 
四 棋子 的 表示 
棋子 的 显示 需要 图 片 ， 每 种 棋子 的 图 案 和 棋盘 使 用 的 对 应 图 片 资源 如 图 15-3 所 示 。 该 
游戏 中 红 方 在 南 ， 黑 方 在 北 。 


黑车 png EE 
寻 急 png 蛙 识 ,png 
| 
红 炮 ,png 红 住 .png ] 
图 15-3 棋子 图 片 资源 
全 走 棋 规 则 


对 于 象棋 来 说 ， 有 马 走 “日 ” 象 走 “ 田 ” 等 一 系列 复杂 的 规则 。 走 法 的 产生 是 博弈 
程序 中 一 个 相当 复杂 而 且 耗 费 运算 时 间 的 工作 ， 不 过 ， 通 过 良好 的 数据 结构 可 以 显著 地 提 
高 生成 的 速度 。 

判断 是 否 能 走 棋 的 算法 如 下 : 

根据 棋子 名 称 的 不 同 ， 按 相应 规则 进行 判断 

(1) 如 果 为 “车 ”， 检 查 是 否 走 直线 ， 及 中 间 是 否 有 子 。 
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(2) 如 果 为 “ 马 ”， 检查 是 否 走 “ 日 ” 字 ， 是 否 整 脚 。 

(3) 如 果 为 “ 炮 ”， 检 查 是 否 走 直线 ， 判 断 是 否 吃 子 ， 如 果 吃 子 ， 则 检查 中 间 是 否 只 
有 一 个 棋子 ， 如 果 不 吃 ， 则 检查 中 间 是 否 有 棋子 。 

(4) 如 果 为 “ 兵 ” 或 “ 卒 ”， 检 查 是 否 走 直线 ， 走 一 步 及 向 前 到 
是 否 横 走 。 

(5) 如 果 为 “将 ”或 “ 帅 ” 检查 是 否 走 直线 ， 走 一 步 及 是 否 超过 范围 。 

(6) 如 果 为 “ 士 ”或 “ 仕 ” 检查 是 否 走 斜 线 ， 走 一 步 及 是 否 超出 范围 。 

(7) 如 果 为 “ 象 ”或 “ 相 ” 检查 是 否 走 “ 田 ” 字 ， 是 否 鉴 脚 ， 及 是 否 超出 范围 。 

那么 如 何 分 辨 棋子 ? 在 程序 中 采用 了 棋子 图 形 对 象 来 获取 。 

在 该 程序 中 ，IsAbleToPut(id,x,y.oldx,oldy) 函 数 实现 判断 是 否 能 走 棋 并 返回 逻辑 值 ， 它 
的 代码 较 复杂 ， 其 参数 含义 如 下 : 

参数 id 代表 走 的 棋子 图 形 对 象 ， 因 为 dict_ChessName 字典 中 存储 的 是 id 对 应 的 棋子 
名 (例如 " 红 马 ")， 如 果 qi_name = dict_ChessName[id]， 获 取 棋 子 名 含 颜 色 信息 ， 而 字符 串 
[了 可 以 获取 字符 串 的 第 2 个 字符 ， 所 以 dict_ChessName[id][1] 意 味 着 取 字 符 串 的 第 2 个 字 
符 ， 例 如 " 红 马 " 取 第 2 个 字符 得 到 " 马 "。 

参数 x 和 y 代表 走 棋 的 目标 位 置 。 参 数 oldx 和 oldy 代表 走动 棋子 的 原始 位 置 。 

IsAbleToPut(id, x, Yoldx.oldy) 函 数 实现 走 棋 规 则 的 判断 。 

例如 “将 ”或 “ 帅 ” 的 走 棋 规则 : 只 能 走 一 格 ， 所 以 原 x 坐标 与 新 位 置 x 坐标 之 差 不 
能 大 于 1， 原 y 坐标 与 新 位 置 y 坐标 之 差 不 能 大 于 1 。 


(mr 


根据 是 否 过 河 ， 


苞 
只 


if(abs (x-oldx)>1 or abs (Y-oldy) >1) : 


return False; 


由 于 不 能 走出 九宫 , 所 以 x 坐标 为 3、4、5 且 0<y<2 或 7<y<9( 因 为 走 棋 时 自己 的 “将 ” 
或 “ 帅 ” 只 能 在 九宫 中 )， 否 则 此 步 违 规 ， 将 返回 False。 

if(x<3 or x>5 or (y>=3 and y<=6)): 

return False; 

最 终 “ 将 ”或 “ 帅 ” 的 走 棋 规 则 如 下 : 

#“ 将 ”或 “ 帅 ” 的 走 棋 判断 

if (qi name==" 将 "or qi_name==" 帅 ") : 
if( (x-oldx)*(y-oldy) !=0) : # 斜 线 走 棋 


return False; 


if(abs (x-oldx)>1 or abs(y-oldy)>1): 
return False; 

if(x<3 or x>5 or (y>=3 and y<=6)): 
return False; 


return True; 


“ 仕 ” 或 “ 士 ” 的 走 棋 规 则 : 只 能 走 斜 线 一 格 , 所 以 原 x 坐标 与 新 位 置 x 坐标 之 差 为 1， 
且 原 y 坐标 与 新 位 置 y 坐标 之 差 也 为 1。 
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if(qi_name==" 士 " or qi _ name==" 仕 ") : 
ifE((x-oldx)*(Y-oldy) 一 0) : 
return False; 
if(abs (x-oldx)>1 or abs (Y-oldy) >1) : 
return False; 


由 于 不 能 走出 九宫 ， 所 以 x 坐标 为 3、4、5 且 0<y<2 或 7<y<9， 否 则 此 步 违 规 ， 将 返 
回 False。 


if(x<3 or x>5 or (y>=3 and Y<=6) ) : 
return False; 

“ 炮 ”的 走 棋 规 则 : 只 能 走 直线 ， 所 以 x 和 y 不 能 同时 改变 ， 即 (x 一 oldx) * (y 一 oldy) = 
0 保证 走 直线 。 然 后 判断 如 果 x 坐标 改变 了 ， 原 位 置 oldx 到 目标 位 置 x 之 间 是 否 有 棋子 ， 
如 果 有 ， 则 累加 之 间 棋 的 个 数 c。 通 过 c 是 否 为 1 且 目标 处 非 已 方 棋子 ， 可 以 判断 是 否 可 
以 走 棋 。 同 样 的 方法 判断 “ 炮 ” 的 y 坐标 改变 时 是 否 可 以 走 棋 。 
“ 兵 ” 或 “ 卒 ” 的 走 棋 规 则 : 只 能 向 前 走 一 步 ， 根 据 是 否 过 河 检 查 是 否 横 走 ， 所 以 x 
与 原 坐标 oldx 改变 的 值 不 能 大 于 1， 同 时 y 与 原 坐标 oldy 改变 的 值 也 不 能 大 于 1。 例 如 红 
兵 如果 过 河 即 是 y<5 游戏 时 红 方 在 南 )。 

#“ 座 ”或 “ 兵 ” 的 走 棋 判断 


if (qi name==" 府 " or qi name==" 兵 ") : # 红 方 在 南 ， 黑 方 在 北 
if((x-oldx) * (y-oldy) !=0) : # 不 是 直线 走 棋 
return False; 
if(abs (x-oldx)>1 or abs(y-oldy)>1): # 走 多 步 ， 不 符合 兵 仅 能 走 一 步 


return False; 
if(y>=5 and (x-oldx) !=0 and qi name==" 兵 ") : 
# 红 兵 未 过 河 且 横向 走 棋 
return False; 


if(y<5 and (x-oldx) !=0 and qi _name==" 卒 ") : # 黑 卒 未 过 河 且 横向 走 棋 


return False; 


if(y-oldy>0 and qi name==" 兵 "): # 兵 后 退 
return False; 
if(y-oldy<0 and qi name==" 卒 ") : # 众 后 退 


return False; 
return True; 


其 余 棋子 的 判断 方法 类 似 ， 这 里 不 再 一 一 介绍 。 

@ 坐标 的 转换 

整个 棋盘 左上 角 的 坐标 为 (0.0)， 右 下 角 的 坐标 为 (8.9)， 如 图 15-4 所 示 。 例 如 “黑车 ” 
的 初始 位 置 即 为 (0.0),“ 黑 将 ”的 初始 位 置 即 为 (4.0),“ 红 帅 ” 的 初始 位 置 即 为 (4.9)。 在 走 
棋 过 程 中 ， 需 要 将 鼠标 像素 坐标 转换 成 棋盘 坐标 ， 棋 盘 方 格 的 大 小 是 76 像素 ， 通 过 整除 
76 解析 出 棋盘 坐标 (x.y)。 
x= (event .X-14) //76 # 换 算 成 棋盘 坐标 
Y= (event.y-14) //76 
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图 15-4 棋盘 坐标 示意 图 


15.4 ”中 国 象棋 实现 的 步 又 : 


首先 导入 tkinter 库 。 视频 讲解 


from tkinter import * 


from tkinter.messagebox import * 


创建 一 个 Canvas， 设 置 其 背景 色 为 白色 ， 用 Canvas 显示 棋盘 中 所 有 的 棋子 。imgs 是 
PhotoImage 对 象 列 表 ， 获 取 所 有 的 棋子 图 片 。 


dict ChessName={} # 定 义 一 个 字典 

例如 ， 本 游戏 中 字典 dict_ChessName 存储 的 内 容 如 下 : 

向: 可 人 0 
' 黑 卒 , 12: ' 黑 卒 , 13: ' 黑 卒 , 14: ' 黑 卒 , 15: ' 黑 卒 , 16: ' 黑 炮 ', 17: ' 黑 炮 ', 18: ' 红 车 ', 19: ' 红 马 ', 


20;' 红 相 ', 21: ' 红 仕 ', 22: ' 红 帅 ' 23:' 红 仕 ' 24: ' 红 相 ' 25: ' 红 马 ', 26: ' 红 车 ', 27: ' 红 兵 ', 28: ' 红 兵 
"29: ' 红 兵 ', 30: ' 红 兵 ', 31: ' 红 兵 , 32: ' 红 炮 ', 33: ' 红 炮 '} 

字典 的 Key 为 每 个 棋子 图 像 的 i4，Value 是 棋子 种 类 名 ,例如 图 像 对 象 11 对 应 的 是 黑 
人 府 。 因 为 首先 建立 Canvas 对 象 id=0 和 棋盘 对 象 d=1， 所 以 棋子 图 像 的 id 是 从 2 开始 的 。 

root=Tk () 

# 创 建 一 个 canvas， 设 置 其 背景 色 为 白色 

cv=Canvas (root, bg='white', width=720, height=800) 

chessname=[" 黑 车 ", "黑马 "," 黑 象 ", " 黑 士 ", " 黑 将 "," 黑 士 ", " 黑 象 ", "黑马 ", "黑车 "， 

:A A ABRs: eA ha A ie A A 

" 红 兵 "," 红 炮 "] 
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on 项 目 案例 开发 
从 入 门 到 实战 一 疏 虫 、 游 戏 和 机 器 学 习 


imgs=[PhotoImage (file="'bmp\\'+chessname[i]+'.png')for i in range(0,22)] 


chessmap=[[-1,-—1,-—1;-1,-1,-1,-1,-1,-1,-1]for y in range(10)] 


dict ChessName={} 间 定 义 一 个 字典 

LocalPlayer=" 红 " #LocalP1ayer 记录 自己 是 红 方 还 是 黑 方 
first=True # 区 分 是 第 1 次 还 是 第 2 次 选中 的 棋子 
IsMyTurn=True 

rect1=0 

rect2=0 


firstCchessid=0 


程序 运行 时 ， 首 先 调用 DrawBoard0 和 LoadChess() 加 载 棋盘 图 片 和 棋子 到 Canvas 中 ; 
LoadChess0 初 始 化 游戏 区 中 各 个 棋子 的 位 置 ， 红 方 在 南 ， 黑 方 在 北 ， 并 且 在 chessmap 多 
P 按 坐标 记录 每 个 棋子 图 像 的 id， 然后 绑 定 Canvas 鼠标 事件 函数 callback0， 也 就 是 鼠标 
击 游戏 画面 时 的 处 理 函 数 ， 在 此 函数 中 处 理 游戏 的 走 棋 吃 子 过 程 。 


了 


he 


pe 


imgl=PhotoImage (file='bmp\\ 棋 盘 .png') 
def DrawBoard() : # 画 棋盘 


pl=cv.create image ((0,0) ,image=imgl) 
cv.coords (pl, (360, 400)) 


def LoadChess(): # 加 载 棋子 
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global chessmap 
# 黑 方 16 个 棋子 
for i in range(0,9) : 
提 " 黑 车 "，" 黑马" " 黑 象 "," 黑 仕 "," 黑 将 "," 黑 仕 "," 黑 象 ", "黑马 ", "黑车 " 
img=imgs [i] 
id=cv.create image((60+76*i,54),image=img) ”#76x76 棋盘 格子 大 小 


dict ChessName[id]=chessname[i]; 间 图 像 对 应 的 是 哪 种 棋子 
chessmap [i] [0]=id # 图 像 ia 
for i in range(0,5): #5 个 卒 
img=imgs [9] 井 卒 图 像 
id=cv.create image((60+76*2*i,54+3*76),image=img) 
#76x76 棋盘 格子 大 小 
chessmap[i*2] [3]=id 
dict ChessName[id]=" 黑 卒 "; # 图 像 对 应 的 是 哪 种 棋子 
img=imgs[10] # 黑 方 炮 


ig=cv.create image ((60+76*1,54+2#+76) ,image=img) #76x76 棋盘 格子 大 小 
chessmap[1] [2]=id 

dict_chessName [id]=" 黑 炮 "; # 图 像 对 应 的 是 哪 种 棋子 
ig=cv.create image((60+76*7,54+2*76),image=img) #76x76 棋盘 格子 大 小 
chessmap[7] [2]=id 

dict_chessName [id]=" 黑 炮 "; ## 图 像 对 应 的 是 哪 种 棋子 

# 红 方 16 个 棋子 

for i in range(0,9) : 


#" 红 车 ","” 红 马 "," 红 相 "," 红 仕 "," 红 帅 ",” 红 仕 "," 红 相 "," 红 马 "," 红 车 " 


起 
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img=imgs [i+11] 
id=cv.create image((60+76*i,54+9*76) , image=img) #76x76 棋盘 格子 大 小 


dict ChessName [id]=chessname[i+11]; 坦 图 像 对 应 的 是 哪 种 棋子 
chessmap[i] [9]=id # 图 像 id 
for i in range(0,5): #5 个 兵 
img=imgs [20] 志 兵 图 像 
id=cv.create image((60+76*2*i, 54+6*76) ,image=img) #76x76 棋盘 格子 大 小 
chessmap[i*2] [6]=id # 图 像 id 
dict ChessName[id]=chessname[20]; # 图 像 对 应 的 是 哪 种 棋子 
img=imgs[211] # 红 方 炮 


id=cv.create image((60+76*1,54+7*76) ,image=img) #76x76 棋盘 格子 大 小 
chessmap[1] [7]=id 

dict_ chessName[id]=" 红 炮 "; # 图 像 对 应 的 是 哪 种 棋子 
id=cv.create image((60+76*7,54+7*76)，,image=img) #76x76 棋盘 格子 大 小 
chessmap[7] [7]=id 


dict ChessName [id]=" 红 炮 "7 # 图 像 对 应 的 是 哪 种 棋子 
# 
DrawBoard () # 画 棋盘 
Loadchess () # 加 载 棋子 
# 


print (dict ChessName) 

cv.bind("<Button-1>", callback) 

cv.pack() 

lablel=Label (root，fg='red'，bg='white'，text=" 红 方 先 走 ") “# 提 示 信 息 标签 
lablel['text']=" 红 方 先 走 1" 

lablel .pack () 

root .mainloop() 


游戏 区 的 单 击 事件 处 理 用 户 走 棋 过 程 。 在 用 户 走 棋 时 ， 首 先 要 选中 自己 的 棋子 (第 1 
次 选择 棋子 )， 所 以 有 必要 判断 是 否 单 击 成 对 方 棋子 了 。 如 果 是 自己 的 棋子 ， 则 firstChessid 
记录 用 户 选 择 的 棋子 ， 同 时 棋子 被 加 上 红色 框 线 示意 被 选中 。 

当 用 户 选 过 已 方 棋子 后 ， 单 击 对 方 棋子 〈secondChessid 记录 用 户 第 2 次 选择 的 棋子 ， 
被 加 上 黄色 框 线 )， 则 是 吃 子 ， 如 果 将 或 帅 被 吃 掉 ， 则 游戏 结束 。 当 然 ， 第 2 次 选择 棋子 有 
可 能 是 用 户 改 变 主意 , 选择 自己 的 另 一 棋子 , 则 firstChessid 重新 记录 用 户 选择 的 己方 棋子 。 

当 用 户 选 过 已 方 棋子 后 ， 在 单 击 的 位 置 无 棋子 ， 则 处 理 没 有 吃 子 的 走 棋 过 程 。 调 
IsAbleToPut(CurSelect, x, y) 判 断 是 否 能 走 棋 , 如果 符合 走 棋 规 则 , 移动 棋子 , 修改 chessmap 
记录 的 棋子 信息 。 

def callback(event) : ## 走 棋 picBoard MouseClick 

global LocalPlayer 

global chessmap 

global rectl, rect2 # 选 中 框图 像 id 
global firstChessid,secondChessid 
global xl1,x2,yl,y2 

global first 


rint ("clicked at", event.x, event.y, LocalPlayer) 
了 至 


= 
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P ython 项 目 案例 开发 
从 入 门 到 实战 一 一 看 虫 、 游 戏 和 机 器 学 习 


X= (event .x-14) //76 # 换 算 棋盘 坐标 
y=(event.y-14)//76 
print ("clicked at", x, y, LocalPlayer) 


et # 第 1 次 单 击 棋子 
XI=X7 
Yl=Yy? 
firstchessid=chessmap [xl] [yl1] 
if not(chessmap [xl1] [y1]==-1) :  # 此 位 置 不 空 有 棋子 
player=dict ChessName [firstChessid] [0] 
# 获 取 单 击 棋子 的 颜色 ， 例 如 “ 红 马 ” 取 红 
if (player!=LocalPlayer): # 颜 色 不 同 
print (" 单 击 成 对 方 棋子 了 !m) 
return 
print ("第 1 次 单 击 ", firstchessid) 
first=False; 
rectl=cv.create rectangle (60+76*x-40, 54+y*76-38, 
60+76*x+80-40, 54+y*76+80-38,outline="red") ，# 画 选中 标记 框 
else: # 第 2 次 单 击 
X2=X7 
Y2=Y7 
secondchessid=chessmap [x2] [y2] 
# 目 标 处 如 果 是 自己 的 棋子 ， 则 换 上 次 选择 的 棋子 
if not (chessmap [x2] [y2]==-1): # 此 位 置 不 空 ， 有 棋子 
player=dict ChessName [secondchessid] [0] # 获 取 单 击 棋子 的 颜色 
if (player==LocalPlayer): ## 如 果 是 自己 的 棋子 ， 则 换 上 次 选择 的 棋子 
firstCchessid=chessmap [x2] [y2] 
print ("第 2 次 单 击 ", firstchessid) 
cv.delete (rect1); # 取 消 上 次 选择 的 棋子 标记 框 
Xl1=X; 
yl=y; 
# 设 置 选择 的 棋子 颜色 
rectl=cv.create rectangle (60+76*x-40,54+y*76-38, 
60+76*x+80-40, 54+y*76+80-38, outline="red") ， # 画 选中 标记 框 
print ("第 2 次 单 击 ", firstchessid) 
return; 
else: # 在 落 子 目标 处 画 框 
rect2=cv.create rectangle (60+76*x-40,54+y*76-38, 
60+76*x+80-40, 54+y*76+80-38, outline="yellow") # 目 标 处 画 框 
# 目 标 处 没 棋子 ， 移 动 棋子 
print ("kkkkk", firstCchessid) 
if (chessmap[x2] [y2]==" " or chessmap[x2] [y2]==-1): 
才 目 标 处 没 棋 子 ， 移 动 棋子 
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print ("目标 处 没 棋子 ， 移 动 棋子 "，, firstchessid, x2, y2, x1l,y1) 
if (IsAbleToPut (firstChessid, x2,y2,xl,yl)): # 判 断 是 否 可 以 走 棋 
print ("can 移动 棋子 ", x1, y1) 
cv.move (firstChessid,76*(x2-x1),76*(y2-y1)); 
非 六 六 六 六 六 六 六 六 六 六 来 六 六 来 闵 六 六 六 六 六 六 六 六 六 六 六 六 六 六 六 六 六 六 六 六 六 六 六 六 六 六 六 六 六 六 六 六 六 六 六 六 六 六 
# 在 map 中 取 掉 原 棋子 
chessmap[x1] [Y1]=-17 
chessmap[x2] [y2]=firstChessid 
cv.delete (rect1); # 删 除 选 中 标记 框 
cv.delete (rect2); # 删 除 目标 标记 框 
非 六 闵 六 六 六 六 六 六 六 六 六 六 六 六 六 六 六 六 六 六 来 六 六 六 来 闵 闵 闵 闵 玉 六 六 六 六 六 六 六 六 六 六 这 闵 六 六 闲 亲 亲 闲 闵 冰 闲 闲 
first=True; 
SetMyTurn (False); 间 该 对 方 了 
lSes 
# 错 误 走 棋 
print ("不 符合 走 棋 规则 ") ; 
showinfo (title=" 提 示 ",message=" 不 符合 走 棋 规则 ") 
return; 
else: 
# 目 标 处 有 棋子 ， 可 以 吃 子 
if (not (chessmap[x2] [y2]==-1) and IsAbleToPut (firstChessid,x2， 
y2,x1,y1)): # 可 以 吃 子 
first=True; 
print ("can 吃 子 ", x1,y1) 
cv.move (firstChessid,76*(x2-x1),76*(y2-y1)); 
非 染 六 闵 闵 闵 宗 闵 率 闪 六 六 六 六 六 宁 闵 六 六 六 六 六 六 六 六 六 六 六 六 六 六 六 率 六 六 六 六 六 弟 闵 六 六 六 交 亲 六 六 冰冰 六 六 六 半 宁 
# 在 map 中 取 掉 原 棋子 
chessmap [x1] [yl1]=-1; 
chessmap [x2] [y2]=firstChessid 
cvV.delete (secondchessid); 
cv.delete (rect1) 7 
cv.delete (rect2); 
非 六 六 六 六 六 半 六 闪 闵 六 六 六 六 闲 弟 六 六 六 六 六 六 六 六 六 六 六 六 六 六 六 六 六 冰 闵 p* 素 六 六 六 六 六 亲 六 六 六 六 六 六 六 六 亲 
if(dict ChessName[secondchessiq] [1]==" 将 "): #" 将 " 
showinfo (title=" 提 示 ",message=" 红 方 你 赢 了 ") 
return; 
if (dict ChessName [secondchessid] [1]==" 帅 "):  #" 帅 " 
showinfo (title=" 提 示 ",message=" 黑 方 你 赢 了 ") 


return; 
#send 
SetMyTurn (False); 砷 该 对 方 了 
else: ## 不 能 吃 子 
print ("不 能 吃 子 "); 


lablel['text']=" 不 能 吃 子 " 
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on 项 目 案例 开发 
从 入 门 到 实战 一 一 爬虫 、 游 戏 和 机 器 学 习 


cv.delete (rect2) 7 坦 删除 目标 标记 框 


SetMyTum0 设 置 该 哪 方 走 棋 ，LocalPlayer 记录 轮 到 哪 方 走 棋 ， 并 在 标签 上 显示 提示 
信息 。 


def SetMyTurn (flag): 

global LocalPlayer 

IsMyTurn=flag 

if LocalPlayer==" 红 " : 
LocalPlayer=" 黑 " 
lablel['text']=" 轮 到 黑 方 走 " 

elses 
LocalPlayer=" 红 " 
lablel['text']=" 轮 到 红 方 走 " 


def IsAbleToPut(id,x,y,oldx,oldy) 实 现 判 断 是 否 能 走 棋 并 返回 逻辑 值 ， 其 代码 较 复杂 。 


def IsAbleToPut(id, x, y, oldx, oldy): 
#oldx，oldy 棋子 在 棋盘 的 原 坐 标 
#x, y 棋子 移动 到 棋盘 的 新 坐标 
qi name=dict ChessName [id] [1] 
# 取 字符 串 中 的 第 2 个 字符 ， 例 如 “ 黑 将 ”中 的 “将 ”， 从 而 得 到 棋子 类 型 
#“ 将 ”或 “ 帅 ”的 走 棋 判 断 
if(qi name==" 将 " or qi name==" 帅 ") : 
if( (x-oldx)*(y-oldy) !=0) : 


return False; 
if(abs (x-oldx)>1 or abs(y-oldy)>1): 
return False; 
if(x<3 or x>5 or (y>=3 and y<=6)): 
return False; 
return True; 
#“ 仕 ”或 “ 士 ” 的 走 棋 判断 
if (qi name==" 士 " or qi_name==" 仕 ") : 
if((x-oldx)*(y-oldy)==0): 
return False; 
if(abs (x-oldx)>1 or abs(y-oldy)>1): 
return False; 
if(x<3 or x>5 or (y>=3 and y<=6)): 
return False; 
return True; 
#“ 象 ”或 “ 相 ” 的 走 棋 判断 
if (qi name==" 象 " or qi name==" 相 ") : 
if( (x-oldx)*(y-oldy)==0): 
return False; 
if (abs (x-oldx) !=2 or abs (Y-oldy) !=2) : 


return False; 
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if(y<5 and qi_name==" 相 ") : 


return False; 


if(y>=9 and di namne==" 象 "): 


return False; 
i=0; j=0; 
if (x-oldx==2): 
i=x-1; 
if (x-oldx==-2): 
i=x+1; 
if (y-oldy==2): 
j=y-1; 
if(y-oldy==-2): 
j=y+1; 
if(chessmap[i] [j]!=-1): 
return False; 
return True; 


#" 马 "的 走 棋 判断 
if (qi name==" 马 "): 
if(abs (x-oldx)*abs (y-oldy) !=2) : 


return False; 
if (x-oldx==2): 


if (chessmap[x-1] [oldy] !=-1) : 


return False; 
if (x-oldx==-2): 


if (chessmap[x+1] [oldy] !=-1) : 


return False; 
if (y-oldy==2): 


if (chessmap[oldx] [y-1] !=-1): 


return False; 
if (y-oldy==-2): 


if(chessmap [oldx] [y+1] !=-1): 


return False; 
return True; 


#“ 车 ”的 走 棋 判断 


if (qi name==" 车 "): 


# 判 断 是 否 为 直线 
if( (x-oldx)*(y-oldy) !=0): 


return False; 


判断 是 否 隔 有 棋子 
if (x!=oldx): 
if (oldx>x): 
t= 
X=O0ldx; 


oldx=t; 


第 15 之 益 智 游戏 一 一 中 国 象棋 1 S 


# 过 河 


志 过 河 


拉 、]j 必须 有 初始 值 


# 整 象 腿 


# 整 马 腿 


# 炊 马 腿 


# 整 马 腿 


# 整 马 腿 


hon 项 目 案例 开发 
从 入 门 到 实战 一 一 仆 虫 、 游 戏 和 机 器 学 习 


for i in range (oldx,x+1): 
1E(1L!=R and Ll=oLldx)s 
if(chessmap [i] [y] !=-1) : 


return False; 


if(y!=oldy): 
if (oldy>y): 
Ey 
y=oldy; 
oldy=t; 


for Jj in range(oldy,y+1): 
if(j!=y and j!=oldy) : 
if (chessmap [x] [j]!=-1): 
return False; 
return True; 
#“ 炮 ”的 走 棋 判 断 
if (qi name==" 炮 ") : 
swapflagx=False; 
swapflagy=False; 
if((x-oldx)*(y-oldy) !=0): 
return False; 
c=0; 
if (x!=oldx): 
if (oldx>x): 
t=x; 
Xx=O0ldx; 
oldx=t; 
swapflagx=True; 
for i in range(oldx,x+1): #for (i=oldx; i<=x; i+=1): 
if(i!=x and i!=oldx): 
if(chessmap[i] [y] !=-1) : 
C=C+17 
if(y!=oldy): 
if (oldy>y): 
ew 
y=oldy; 
oldy=t; 
swapflagy=True; 
for ]j in rangel(oldy,y+1): #for(j=oldy; j<=y; j+=1): 
if(j!=y and j!=oldy): 
if (chessmap[x] [] !=-1) : 
CCGt1s 
telys 
return False; # 与 目标 处 间隔 1 个 以 上 的 棋子 
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He 0) # 与 目标 处 无 间隔 棋子 
if (swapflagx==True): 
t=x; 
X=0ldx; 
oldx=t; 
if (swapflagy==True): 


if (chessmap[x] [y] !=-1) : 
return False; 
if (c==1): # 与 目标 处 间隔 1 个 棋子 
if (swapflagx==True): 
t=x; 
x=O0ldx; 
oldx=t; 
if (swapflagy==True): 
t=y; 
y=oldy; 
oldy=t; 
if (chessmap[x] [y]==-1): # 如 果 目 标 处 无 棋子 ， 则 不 能 走 此 步 
return False; 
return True; 
#“ 座 ”或 “ 兵 ” 的 走 棋 判 断 
if (qi name == " 卒 " or qi name==" 兵 ") : 
if( (x-oldx)*(y-oldy) !=0) : # 不 是 直线 走 棋 
return False; 
if(abs (x-oldx)>1 or abs(y-oldy)>1): 
# 走 多 步 ， 不 符合 兵 只 能 走 一 步 
return False; 
if(y>=5 and (x-oldx)!=0 and qi_name==" 兵 ") : 
坦 未 过 河 且 横向 走 棋 
return False; 
if(y<5 and (x-oldx) !=0 and qi_ name==" 府 "): 


# 未 过 河 且 横 向 走 棋 
return False; 
if(y-oldy>0 and qi name==" 兵 "): # 后 退 
return False; 
if(y-oldy<0 and qi name==" 卒 ") : # 后 退 


return False; 
return True; 


return True; 


其 运行 效果 如 图 15-5 和 图 15-6 所 示 。 这 个 游戏 ， 双 方 在 本 机 轮 下 ， 读 者 可 以 根据 网 
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络 五 子 棋 的 UDP 通信 知识 完善 本 游戏 ， 从 而 实现 网 络 版 中 


图 15-6 中 国 象棋 运行 界面 
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16.1 人 物 拼图 游戏 介绍 


拼图 游戏 将 一 幅 图 片 分 割 成 若干 拼 块 ， 并 将 它们 随机 打 乱 顺 序 ， 当 将 
所 有 拼 块 都 放 回 原 位 置 时 就 完成 了 拼图 〈 游 戏 结束 )。 

本 人 物 拼 图 游戏 为 3 行 3 列 ， 拼 块 以 随机 顺序 排列 ， 玩 家 通过 用 鼠标 
单 击 空白 块 四 周 来 交换 它们 的 位 置 ， 直 到 所 有 拼 块 都 回 到 原 位 置 。 拼 图 游戏 的 运行 界面 如 
图 16-1 所 示 。 


图 16-1 拼图 游戏 的 运行 界面 


| Ba 项 目 案例 开发 
从 入 门 到 实战 一 一 爬虫 、 游 戏 和 机 器 学 习 


16.2 ”程序 设计 的 思路 


游戏 程序 首先 将 图 片 分 割 成 相应 的 3 行 3 列 的 拼 块 ， 并 按 顺序 编号 ,动态 生成 一 个 大 
小 为 3x3 的 列表 board， 存 放 0 一 8 的 数 ， 每 个 数字 代表 一 个 拼 块 (例如 3x3 的 游戏 拼 块 的 
编号 如 图 16-2 所 示 )， 其 中 8 号 拼 块 不 显示 。 


图 16-2 ” 拼 块 编号 示意 图 

游戏 开始 时 ， 随 机 打 乱 数组 board, 例如 board[0][0] 是 5 号 拼 块 ， 则 在 左上 角 显 示 编号 

是 5 的 拼 块 。 根据 玩家 用 鼠标 单 击 的 拼 块 和 空白 块 所 在 位 置 来 交换 board 数组 对 应 的 元 素 ， 
最 后 通过 判断 元 素 的 排列 顺序 来 判断 是 否 已 经 完成 游戏 。 


16.3 ”关键 技术 
16.3.1 复制 和 粘贴 图 像 区 域 


使 用 crop0 方 法 可 以 从 一 幅 图 像 中 裁剪 指定 区 域 ， 例 如 : 

from PIL import Image 

im=Image.open("D:\\test.jpg") 

box=(100,100, 400, 400) 

region=im.crop (box) 

该 区 域 使 用 四 元 组 来 指定 。 四 元 组 的 坐标 是 ( 左 ,上 , 右 ,下 )。 在 PIL 中 指定 坐标 系 的 左上 
坐标 为 (0,0)。 用 户 可 以 旋转 上 面 代码 获取 的 区 域 , 然后 使 用 paste0 方 法 将 该 区 域 放 回去 ， 
体 实现 如 下 : 

region=region.transpose (Image .ROTATE 180) # 逆 时 针 旋 转 180° 

im.paste (region, box) 


16.3.2 ”调整 尺寸 和 旋转 


如 果 要 调整 一 幅 图 像 的 尺寸 ， 可 以 调用 resize() 方 法 。 该 方法 的 参数 是 一 个 元 组 ， 用 来 
指定 新 图 像 的 大 小 : 


out=im.resize((128,128)) 


ny 


并 
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如 果 要 旋转 一 幅 图 像 ， 可 以 使 用 逆 时 针 方 式 表示 旋转 角度 ， 然 后 调用 rotate() 方 法 : 
out=im-rotate(45) ## 逆 时 针 旋转 45° 


16.3.3 ”转换 成 灰 度 图 像 


对 于 彩色 图 像 ， 不 管 其 图 像 格式 是 PNG、BMP 还 是 JPG， 在 PIL 中 使 用 Image 模块 
的 open0 函 数 打 开 后 ， 返 回 的 图 像 对 象 的 模式 都 是 “RGB ”。 对 于 灰 度 图 像 ， 不 管 其 图 像 格 
式 是 PNG、BMP 还 是 了 PG， 打 开 后 模式 都 为 “L”。 

对 于 PNG、BMP 和 卫 G 彩色 图 像 格式 之 间 的 互相 转换 , 都 可 以 通过 Image 模 块 的 open( 
和 save() 函 数 来 完成 。 具 体 来 说 就 是 ， 在 打开 这 些 图 像 时 PIL 会 将 它们 解码 为 三 通道 的 
“RGB” 图 像 ， 用 户 可 以 基于 这 个 “RGB ”图 像 对 其 进行 处 理 ， 处 理 完毕 后 使 用 save(O) 函 数 
可 以 将 处 理 结果 保存 成 PNG、BMP 和 JPG 中 的 任何 格式 ， 这 样 也 就 完成 了 几 种 格式 之 间 
的 转换 。 当 然 ， 对 于 不 同 格式 的 灰 度 图 像 ， 也 可 以 通过 类 似 途径 完成 ， 只 是 PIL 解码 后 是 
模式 为 “IL” 的 图 像 。 

这 里 详细 介绍 一 下 Image 模块 的 convert0 函 数 ， 用 于 不 同 模式 图 像 之 间 的 转换 。 

convert0 函 数 有 3 种 形式 的 定义 ， 它 们 的 定义 形式 如 下 : 

im.convert (mode) 

im.convert ('P', **options) 


im.convert (mode, matrix) 

使 用 不 同 的 参数 ， 将 当前 的 图 像 转换 为 新 的 模式 (在 PIL 中 有 9 种 不 同 模式 ， 分 别 为 
1、L、P、RGB、RGBA、CMYK、YCbCr、I、F)， 并 产生 新 的 图 像 作 为 返回 值 。 

例如 : 


from PIL import Image # 或 直接 import Image 


im=Image.open('a.jpg') 

iml=im.convert ('L') # 将 图 片 转换 成 灰 度 图 

“LIL” 模式 的 图 像 为 灰色 图 像 ， 它 的 每 个 像素 用 8 个 bit 表示 ，0 表示 黑 ，255 表示 白 ， 
其 他 数字 表示 不 同 的 灰 度 。 在 PIL 中 ， 从 “RGB” 模 式 转 换 为 “L” 模 式 是 按照 下 面 的 公 
式 进行 的 : 


L=R*299/1000+G*587/1000+ B*114/1000 
打开 图 片 并 转换 成 灰 度 图 的 方法 如 下 : 
im=Image.open('a.jpg') .convert ('L) 
如 果 转 换 成 黑白 图 像 〈 二 值 图 像 )， 也 就 是 模式 为 “1” 的 图 像 〈 非 黑 即 白 )， 它 的 每 
个 像素 用 8 个 bit 表 示 ，0 表示 黑 ，255 表示 白 。 下 面 将 彩色 图 像 转换 为 黑白 图 像 。 


from PIL import Image # 或 直接 import Image 


im=Image.open('a.jpg') 


iml=im.convert ('1') # 将 彩色 图 像 转 换 成 黑白 图 像 
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16.3.4 ”对 像素 进行 操作 


getpixel(x.y) 用 于 获取 指定 像素 的 颜色 ， 如 果 图 像 为 多 通道 ， 则 返回 一 个 元 组 。 该 方法 
的 执行 比较 慢 ， 如 果 用 户 需要 使 用 Python 处 理 图 像 中 的 较 大 部 分 数据 ， 可 以 使 用 像素 访问 
对 象 (load0) 或 者 getdata() 方 法 )。putpixel(xy,color) 可 以 改变 单个 像素 点 的 颜色 。 


img=Image .open ("smallimg.png") 

img.getpixel ((4,4)) # 获 取 像 素 的 颜色 

img.putpixel ((4,4), (255,0,0)) # 改 变 单个 像素 点 为 红色 

img.save ("imgl .png", "png") 

说 明 : getpixel0 得 到 图 片 img 的 坐标 为 (4,4) 的 像素 点 ，putpixel0 将 坐标 为 (4,4) 的 像素 
点 变 为 (255,0,0) 的 颜色 ， 即 红色 。 


16.4 程序 设计 的 步骤 


16.4.1 Python 处 理 图 片 切割 


使 用 PIL 库 的 Image 模块 中 的 crop0) 方 法 可 以 从 一 幅 图 像 中 裁剪 指定 区 域 ， 该 区 域 使 
用 四 元 组 来 指定 , 四 元 组 的 坐标 是 ( 左 ,上 , 右 ,下 ). 在 PIL 中 指定 坐标 系 的 左上 角 坐 标 为 (0.0)。 
其 具体 实现 如 下 : 


from PIL import Image 


img=Image .open (r'C:\woman.jpg') 

bozx=(100,100, 400, 400) 

region=img.crop (box) # 裁 切 图 片 

# 保 存 裁 切 后 的 图 片 

region.save('crop.jpg') 

在 本 游戏 中 需要 把 图 片 分 割 成 3 行 X3 列 的 图 片 块 ， 在 上 面 的 基础 上 指定 不 同 的 区 域 
即 可 裁剪 、 保 存 。 为 了 更 通用 一 些 ， 编 成 splitimage(src,rownum,colnum,dstpath) 函 数 ， 实 现 
将 指定 的 src 图 片 文件 分 割 成 rownumxcolnum 数量 的 小 图 片 块 。 其 具体 实现 如 下 : 


import os 


from PIL import Image 
def splitimage(src, rownum, colnum, dstpath): 
img=Image.open (src) 
w, h=img.size # 图 片 大 小 
if rownum<=h and colnum<=w: 
print('Original image info: %sx%s, $s5, $5' $ (w, h, img.format, 


img .mode)) 
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print (" 开 始 处 理 图 片 切割 ， 请 稍 候 …") 


s=05s.path.split (src) 


TE dsepaeD LE # 没 有 输入 路 径 
dstpath=s[0] # 使 用 源 图 片 所 在 目录 s [0] 

En=3 TN slre( ey #s [1] 是 源 图 片 文件 名 

basename=fn[0] # 主 文件 名 

ext=fn[-1] # 扩 展 名 

num=0 

rowheight = h #rownum 

colwidth = w #colnum 


for r in range (rownum): 
for c in range(colnum): 
box=(c*colwidth, r*rowheight, (c+1)*colwidth, (r+1)*rowheight) 
img.crop (box) .save (os.path.join(dstpath, basename+' ' + 
str (num)+'.'+ext)) 
num=num+1 
print (' 图 片 切割 完毕 ， 共 生成 $s 张 小 图 片 。' % num) 
else: 
print (' 不 合法 的 行列 切割 参数 ! ' ) 
src=input (' 请 输入 图 片 文件 路 径 : ') 
#src="C:\woman.png" 
if os.path.isfile(src) : 
dstpath=input (' 请 输入 图 片 输出 目录 (不 输入 路 径 则 表示 使 用 源 图 片 所 在 目录 ): ') 
if (dstpath=='') or os.path.exists (dstpath): 
row=int (input (' 请 输入 切割 行 数 : ') ) 
col=int (input (' 请 输入 切割 列 数 : ') ) 
if row>0 and col>0: 
splitimage (src, row, col, dstpath) 
elsee 
Print (' 无 效 的 行列 切割 参数 !') 
e136 
print (' 图 片 输出 目录 $s 不 存在 ! ' s dstpath) 
WIIG 
print (' 图 片 文件 $s 不 存在 ! ' % src) 
运行 结果 如 下 : 
请 输入 图 片 文件 路 径 : C:\woman .png 
请 输入 图 片 输出 目录 (不 输入 路 径 则 表示 使 用 源 图 片 所 在 目录 ): 
请 输入 切割 行 数 : 3 
请 输入 切割 列 数 : 3 
Original image info: 283x212, PNG, RGBA 


开始 处 理 图 片 切割 ， 请 稍 候 … 
图 片 切割 完毕 ， 共 生成 9 张 小 图 片 。 
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16.4.2 ”游戏 的 逻辑 实现 


@ 定义 常量 及 加 载 图 片 


from tkinter import * 
from tkinter.messagebox import * 
import random 
# 定 义 常量 
# 画 布 的 尺寸 
WIDTH=312 
HEIGHT=450 
# 图 像 块 的 边 长 
IMAGE WIDTH=WIDTH // 3 
IMAGE HEIGHT=HEIGHT // 3 
# 游 戏 的 行 / 列 数 
ROWS=3 
COLS=3 
# 移 动 步 数 
steps=0 
# 保 存 所 有 图 像 块 的 列表 
board=[[0, 1, 2], 
[3, 4, 5], 
| BT | 
root=Tk(' 拼 图 2017') 
root .title ("拼图 -- 夏 敏捷 2017-10-5") 
# 载 入 外 部 事先 生成 的 9 个 小 图 像 块 
Pics=[] 
for i in range(9) : 
filename="woman "+str(i)+".png" 
Pics.append (PhotoImage (file=filename)) 


加 图 像 块 类 


orderID 属性 是 每 个 图 像 块 〈 拼 块 ) 对 应 的 编号 。 
# 图 像 块 ( 拼 块 ) 类 


class Square: 
def 3 (self, orderID): 
self.orderID=orderID 


def drawl(self, canvas, board pos): 
img=Pics[self.orderID] 


canvas.create image (board pos, image=img) 


@ 初始 化 游戏 


每 个 图 像 块 ( 拼 块 ) 是 一 个 Square 对 象 ,具有 draw 功能 ,即将 本 拼 块 图 片 绘制 到 Canvas 


Iandom.shuffle(board) 打 乱 二 维 列表 只 能 按 行 进行 ， 所 以 使 有 


| 302 


维 列表 来 实现 编号 的 打 


第 16 章 娱乐 游戏 一 一 人 物 拼图 游戏 1 6 


乱 。 在 打 乱 图 像 块 后 ， 根 据 编号 生成 对 应 的 图 像 块 〈 拼 块 ) 到 board 列表 中 。 


def init board() : 
# 打 乱 图 像 块 
L=list (range (9)) #I 列表 中 [0,1,2,3,4,5,6,7,8] 
random. shuffle (L) 
# 填 充 拼图 板 
for i in range (ROWS): 


for j in range (COLS): 
idx=i*ROWS+j 
orderID=L[idx] 
if orderID is 8: #8 号 拼 块 不 显示 ， 所 以 存 为 None 
board[i] [j]=None 
else: 
board[i] [j]=Square (orderID) 
人 @ 绘制 游戏 界面 中 的 各 元 素 
def drawBoard (canVas) : 
# 面 黑 框 
canvas.create polygon((0, 0, WIDTH, 0, WIDTH, HEIGHT, 0, HEIGHT), 
width=1,outline='Black') 
# 画 所 有 图 像 块 
for i in range (ROWS): 
for j in range (COLS) : 
if board[i]l[j] is not None: 
board[i] [j] .draw(canvas， (IMAGE WIDTH*(j+0.5),IMAGE 
HEIGHT* (i+0.5))) 


全 鼠标 事件 
将 单 击 位 置换 算 成 拼图 板 上 的 棋盘 坐标 ， 如 果 单 击 空位 置 ， 什 么 也 不 移动 ， 否 则 依次 
检查 被 单 击 当前 图 像 块 的 上 、 下 、 左 、 右 是 否 有 空位 置 ， 如 果 有 ， 就 移动 当前 图 像 块 。 


def mouseclick (pos): 


te Th 


global steps 

# 将 单 击 位 置换 算 成 拼图 板 上 的 棋盘 坐标 
r=int (pos.y // IMAGE HEIGHT) 
c=int (pos.x // IMAGE WIDTH) 


Pe 3 nd 3 # 单 击 位 置 在 拼图 板 内 才 移动 图 片 
if board[r] [c] is None: # 单 击 空 位 置 ， 什 么 也 不 移动 
return 
LSe 


# 依 次 检查 被 单 击 当 前 图 像 块 的 上 、 下 、 左 、 右 是 否 有 空位 置 ， 如果 有 ， 就 移动 当前 图 像 块 
current_ square=board[r] [c] 


if r-1>=0 and board[r-1][c] is None: 埋 判断 上 面 
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board[r] [cl=None 
board[r-1] [c]=current square 
Steps+=1 
elif c+1<=2 and board[r] [c+1] is None: 间 判 断 右 面 
board[r] [c]=None 
board[r] [c+1]=current square 
steps+=1 
elif r+1<=2 and board[r+1][c] is None: 间 判 断 下 面 
board[r] [c]=None 
board[r+1] [c]=current square 
steps+=1 
elif c-1>=0 and board[r][c-1] is None: 朝 判 断 左面 
board[r] [c]=None 
board[r] [c-1]=current square 
steps+=1 
#print (board) 
labell["text"]=" 步 数 : "+str (steps) 
cv.delete('all') # 清 除 画 布 上 的 内 容 
drawBoard (cv) 
YE wnt 
showinfo (title=" 恭 喜 ",message=" 你 成 功 了 ! ") 


@ 答 赢 的 判断 
判断 拼 块 的 编号 是 否 为 有 序 的 ， 如 果 不 是 有 序 的 ， 则 返回 False。 


def win() : 
for i in range (ROWS) : 
for j in range (COLS) : 
if board[i]l [j] is not None and board[i][j] .orderID!=i * ROWS + j: 
return False 


return True 


人 @ 重 置 游戏 


def play game(): 
global steps 
steps=0 
init board() 


@ “重新 开始 ”按钮 的 单 击 事件 


def callBack2(): 
print ("重新 开始 ") 
play_game () 
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Pygame 最 初 由 Pete Shinners 开发 ， 它 是 一 个 跨 平 台 的 Python 模块 ， 专 为 电子 游戏 设 
计 ， 包 含 图 像 、 声 音 功 能 和 网 络 支持 ， 这 些 功能 使 开发 者 很 容易 用 Python 写 一 个 游戏 。 虽 
然 不 使 用 Pygame 也 可 以 写 一 个 游戏 , 但 如 果 能 充分 利用 Pygame 库 中 已 经 写 好 的 代码 , 开 
发 要 容易 得 多 。Pygame 能 把 游戏 设计 者 从 低级 语言 (例如 C 语言 ) 的 束缚 中 解放 出 来 ， 
专注 于 游戏 逻辑 本 身 。 

由 于 Pygame 很 容易 使 用 且 跨 平台 , 所 以 在 游戏 开发 中 十 分 受 欢迎 。 因为 Pygame 是 开 


放 源 代码 的 软件 ， 也 促使 一 大 批 游戏 开发 者 为 完善 和 增强 它 的 功能 而 努力 。 


17.1 Pygame 基础 知识 


17.1.1 安装 Pygame 库 


在 开发 Pygame 程序 之 前 , 需要 安装 Pygame 库 。 用 户 可 以 通过 Pygame 国电 下 
的 官方 网 站 “http://www.pygame.org/download.shtml” 下 载 源 文件 ， 安 装 指 视频 讲解 
导 也 可 以 在 相应 页 面 找到 。 

一 旦 安装 了 Pygame， 就 可 以 在 IDLE 交互 模式 中 输入 以 下 语句 检验 是 否 安装 成 功 : 


>>> import pygame 
>>> print (pygame .ver) 
1.9.2a0 


1.9.2 是 Pygame 的 最 新 版 本 ， 读 者 也 可 以 找 一 找 其 他 更 新 的 版 本 。 


17.1.2 ”Pygame 的 模块 
Pygame 有 大 量 可 以 被 独立 使 用 的 模块 。 对 于 计算 机 的 常用 设备 , 都 有 对 应 的 模块 进行 
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控制 ， 另 外 还 有 其 他 一 些 模块 ， 例 如 pygame.display 是 显示 模块 、pygame.keyboard 是 键盘 
模块 、pygame.mouse 是 鼠标 模块 ， 如 表 17-1 所 示 。 


表 17-1 Pygame 软件 包 中 的 模块 


模 块 名 功 能 
pygame.cdrom 访问 光驱 
pygame.cursors 加 载 光标 
pygame.display 访问 显示 设备 
pygame.draw 绘制 形状 、 线 和 点 
pygame.event 管理 事件 
pygame.font 使 用 字体 
pygame.image 加 载 和 存储 图 片 
pygame.joystick 使 用 游戏 手柄 或 者 类 似 的 东西 
pygame key 读 取 键 盘 按 键 
pygame.mixer 声音 
pygame.mouse 鼠标 
pygame.movie 播放 视频 
pygame.music 播放 音频 
pygame.overlay 访问 高 级 视频 车 加 
pygame Python 模块 ， 专 为 电子 游戏 设计 
pygame .rect 管理 矩形 区 域 
pygame.sndarray 操作 声音 数据 
pygame.sprite 操作 移动 图 像 
pygame.surface 管理 图 像 和 屏幕 
pygame.surfarray 管理 点 阵 图 像 数 据 
pygame .time 管理 时 间 和 帧 信息 
pygame.transform 缩放 和 移动 图 像 


建立 Pygame 项 目 和 建立 其 他 Python 项 目的 方法 一 样 ， 在 IDLE 或 文本 编辑 器 中 新 建 
一 个 空 文档 ， 需 要 告诉 Python 该 程序 用 到 了 Pygame 模块 。 

为 了 实现 此 目的 ， 这 里 使 用 一 个 import 指令 ， 该 指令 告诉 Python 载 入 外 部 模块 。 例 
如 输入 下 面 两 行 在 新 项 目 中 引入 必要 的 模块 : 

import pygame, sys, time, random 

from pygame.locals import * 

第 1 行 引 入 Pygame 的 主要 模块 、sys 模块 、time 模块 和 random 模块 。 

第 2 行 告诉 Python 载 入 pygame.locals 的 所 有 指令 使 它们 成 为 原生 指令 ， 这 样 在 使 
这 些 指 令 时 就 不 需要 用 全 名 调用 。 
于 硬件 和 游戏 的 兼容 性 或 者 请 求 的 驱动 没有 安装 的 问题 ， 有 些 模块 可 能 在 某 些 平台 
上 不 存在 ， 可 以 用 None 测试 一 下 。 例 如 测试 字体 是 否 载 入 : 


if pygame .font is None: 
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| 项 目 案例 开发 
从 入 门 到 实战 一 一 怜 虫 、 游 戏 和 机 器 学 习 
print ("The font module is not available!") 


pygame.quit () ## 如 果 没 有 则 退出 Pygame 的 应 用 环境 
下 面 对 常用 模块 进行 简要 说 明 。 
@ pygame.surface 
该 模块 中 有 一 个 surface() 函 数 ，surface() 函 数 的 一 般 格式 如 下 : 


pygame .surface ( (width, height), flags=0, depth=0, masks=none) 


它 返 回 一 个 新 的 surface 对 象 。 这 里 的 surface 对 象 是 一 个 有 确定 尺寸 的 空 图 像 ， 可 以 
用 它 进 行 图 像 的 绘制 与 移动 。 

@ pygame.locals 

在 pygame.locals 模块 中 定义 了 Pygame 环境 中 用 到 的 各 种 常量 ， 而 且 包 括 事件 类 型 、 
按键 和 视频 模式 等 的 名 字 ， 在 导入 所 有 内 容 (from pygame.locals import *) 时 用 起 来 很 
安全 。 

如 果 用 户 知道 需要 的 内 容 ， 也 可 以 导入 具体 的 内 容 (例如 from pygame.locals import 
FULLSCREEN )。 

@ pygame.display 

pygame.display 模块 包括 处 理 Pygame 显示 方式 的 函数 , 其 中 包括 普通 窗口 和 全 屏 模式 。 

游戏 程序 通常 需要 下 面 的 函数 : 

1) flipOmpdateO 

(1) flip0: 更 新 显示 。 一 般 来 说 , 在 修改 当前 屏幕 的 时 候 要 经 过 两 步 ， 首 先 需要 对 get_ 
surface() 函 数 返 回 的 surface 对 象 进行 修改 ， 然 后 调用 pygame.display.flip() 更 新 显示 以 反映 
所 做 的 修改 。 

(2) update(): 在 只 想 更 新 屏幕 一 部 分 的 时 候 使 用 update() 函 数 ， 而 不 是 fipO 函 数 。 

2) set mode() 

该 函数 建立 游戏 窗口 ， 返 回 surface 对 象 。 它 有 3 个 参数 ， 第 1 个 参数 是 元 组 ， 用 于 指 
定 窗口 的 尺寸 ; 第 2 个 参数 是 标志 位 ， 有 具体 含义 如 表 17-2 所 示 ， 例 如 FULLSCREEN 表示 
全 屏 ， 默 认 值 为 不 对 窗口 进行 设置 ， 读 者 可 根据 需要 选用 ， 第 3 个 参数 为 色 深 ， 用 于 指定 
窗口 的 色彩 位 数 。 


表 17-2 set_mode 的 窗口 标志 位 的 参数 取 值 


窗口 标志 位 功 能 
FULLSCREEN 创建 一 个 全 屏 窗口 
DOUBLEBUF 创建 一 个 “ 双 缓冲 ”窗口 ， 建 议 在 HWSURFACE 或 者 OPENGL 时 使 用 
HWSURFACE 创建 一 个 硬件 加 速 的 窗口 ， 必 须 和 FULLSCREEN 同时 使 放 
OPENGL 创建 一 个 OPENGL 演 染 的 窗口 
RESIZABLE 创建 一 个 可 以 改变 大 小 的 窗口 
NOFRAME 创建 一 个 没有 边框 的 窗口 


3) set caption() 
该 函数 设 定 游戏 程序 的 标题 。 当 游戏 以 窗口 模式 〈 对 应 于 全 屏 ) 运行 时 尤其 有 用 ， 因 
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为 该 标题 会 作为 窗口 的 标题 。 

4) get surface() 

该 函数 返回 一 个 可 用 来 画图 的 surface 对 象 。 

@ pygame.font 

pygame.font 模块 用 于 表现 不 同 字 体 ， 可 以 用 于 文本 。 

5) pygame.sprite 

pygame.sprite 模块 有 两 个 非常 重要 的 类 sprite 精灵 类 和 group 精灵 组 。 

sprite 精灵 类 是 所 有 可 视 游 戏 的 基 类 。 为 了 实现 自己 的 游戏 对 象 ， 需 要 子 类 化 sprite， 

盖 它 的 构造 函数 ， 以 设 定 image 和 rect 属性 (决定 sprite 的 外 观 和 放置 的 位 置 )， 再 履 盖 

update() 方 法 。 在 sprite 需要 更 新 的 时 候 可 以 调用 update() 方 法 。 

group 精灵 组 的 实例 用 作 sprite 精灵 对 象 的 容器 。 在 一 些 简单 的 游戏 中 ， 只 要 创建 名 为 
sprites、allsprite 或 是 其 他 类 似 的 组 ， 然 后 将 所 有 sprite 精灵 对 象 添加 到 上 面 即 可 。 当 group 
精灵 组 对 象 的 update() 方 法 被 调用 时 会 自动 调用 所 有 sprite 精灵 对 象 的 update() 方 法 。group 
精灵 组 对 象 的 clear() 方 法 用 于 清理 它 包含 的 所 有 sprite 对 象 〈 使 用 回调 函数 实现 清理 )， 
group 精灵 组 对 象 的 draw() 方 法 用 于 绘制 所 有 的 sprite 对 象 。 

©@ pygame.mouse 

该 模块 用 来 管理 鼠标 。 

。 pygame.mouse.set_visible(False/true): 隐藏 /显示 鼠标 光标 。 

。 pygame.mouse.get_pos():; 获取 鼠标 位 置 。 

【7] pygame.event 

pygame.event 模块 会 追踪 鼠标 单 击 、 鼠标 移 动 、 按 键 按 下 和 释放 等 事件 。 其 中 , pygame 
.event.get () 可 以 获取 最 近 事 件 列表 。 

【8) pygame.image 

这 个 模块 用 于 处 理 保存 在 GIF、PNG 或 者 JPEG 内 的 图 形 ， 用 户 可 以 用 load0 函 数 来 
读 取 图 像 文 件 。 


17.2 Pygame 的 使 用 


本 节 主 要 讲解 用 Pygame 开发 游戏 的 逻辑 、 鼠 标 事件 的 处 理 、 键 盘 事 件 的 处 理 、 字 体 
的 使 用 和 声音 的 播放 等 基础 知识 ， 最 后 以 一 个 “移动 的 坦克 ”例子 来 体现 这 些 基 础 知识 的 


以 


17.2.1 Pygame 开发 游戏 的 主要 流程 


Pygame 开发 游戏 的 基础 是 创建 游戏 窗口 , 核心 是 处 理事 件 、 更 新 游戏 状态 和 在 屏幕 上 
绘图 。 游 戏 状态 可 理解 为 程序 中 所 有 变量 值 的 列表 。 在 有 些 游戏 中 ， 游 戏 状态 包括 存放 人 
物 健康 和 位 置 的 变量 、 物 体 或 图 形 位 置 的 变化 ， 这 些 值 可 以 在 屏幕 上 显示 。 

物体 或 图 形 位 置 的 变化 只 有 通过 在 屏幕 上 绘图 才能 看 出 来 。 
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从 入 门 到 实战 一 疏 虫 、 游 戏 和 机 器 学 习 


可 以 简单 地 抽象 出 Pygame 开发 游戏 的 主要 流程 ， 如 图 17-1 所 示 。 


进入 事件 循环 


图 17-1 Pygame 开发 游戏 的 主要 流程 


下 面 举 一 个 具体 例子 来 说 明 。 
圆 77-! 使 用 Pygame 开发 一 个 显示 “Hello World!” 标 题 的 游戏 窗口 。 


import pygame # 导 入 pygame 模块 
from pygame.locals import * 


import sys 

def hello world() : 
pygame.init () # 任 何 Pygame 程序 均 需 要 执行 此 语句 进行 模块 的 初始 化 
# 设 置 窗口 的 模式 ，(680, 480) 表示 窗口 像素 
# 此 函数 返回 一 个 surface 对 象 ， 本 程序 不 使 用 它 ， 故 没 保存 到 对 象 变 量 中 
pygame.display.set mode((680,480)) 
pygame.display.set caption('Hello World!') ## 设 置 窗口 标题 


# 无 限 循 环 ， 直 到 接收 到 窗口 关闭 事件 
while True: 
# 处 理事 件 
for event in pygame.event.get(): 
if event .type==QUIT: # 接 收 到 窗口 关闭 事件 
PYgame .quit () 井 退 出 
sys.exit () 
# 将 surface 对 象 绘制 在 屏幕 上 
pygame.display.update() 
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if _ name ==" main ": 


hello world() 
程序 运行 后 仅见 到 黑色 的 游戏 窗口 ， 标 题 是 “Hello World!”， 如 图 17-2 所 示 。 
[= 


芍 Hello Worldt 


图 17-2 用 Pygame 开发 的 游戏 窗口 


在 导入 Pygame 模块 后 ， 任 何 Pygame 游戏 程序 捧 需 要 执行 pygame.init() 语 句 进 行 模块 
的 初始 化 ， 它 必须 在 进入 游戏 的 无 限 循环 之 前 被 调用 。 这 个 函数 会 自动 初始 化 其 他 所 有 模 
块 〈 例 如 pygame.font 和 pygame.image)， 通 过 它 载 入 驱动 和 硬件 请 求 ， 这 样 游戏 程序 才 可 
以 使 用 计算 机 上 的 所 有 设备 ， 比 较 费 时 间 。 如 果 只 使 用 少量 模块 ， 应 该 分 别 初始 化 这 些 模 
块 以 六 省 时 间 ， 例 如 pygame.sound.init0 仅 仅 初 始 化 声音 模块 。 

该 代码 中 有 个 无 限 循环 ， 每 个 Pygame 程序 都 需要 它 ， 在 无 限 循环 中 可 以 做 以 下 操作 。 

(1) 处 理事 件 : 例如 鼠标 、 键 盘 、 关 闭 窗口 等 事件 。 

(2) 更 新 游戏 状态 : 例如 坦克 的 位 置 变化 、 数 量变 化 等 。 

(3) 在 屏幕 上 绘图 : 例如 绘制 新 的 敌 方 坦克 等 。 

不 断 重 复 上 面 的 3 个 步骤 ， 从 而 完成 游戏 逻辑 。 

在 本 例 代 码 中 仅仅 处 理 关闭 窗口 事件 , 也 就 是 玩家 关闭 窗口 时 pygame.quit() 退 出 游戏 。 


17.2.2 ”Pygame 的 图 像 /图 形 绘制 


@ Pygame 的 图 像 绘 制 

Pygame 支持 多 种 存储 图 像 的 方式 (也 就 是 图 片 格式 )， 例 如 JPEG、PNG 等 ， 具 体 支 
持 JPEG (一 般 扩 展 名 为 .jpg 或 者 jpeg， 数 码 相 机 、 网 上 的 图 片 基本 上 都 是 这 种 格式 ， 这 是 
一 种 有 损 压缩 方式 ， 尽 管 对 图 片 的 质量 有 些 损 坏 ， 但 对 于 减 小 文件 尺寸 非常 棒 ， 其 优点 很 
， 只 是 不 支持 透明 )、PNG (支持 透明 ， 无 损 压缩 )、GIF (网 上 使 用 的 很 多 ， 支 持 透 明 
和 动画 ， 但 只 能 有 256 种 颜色 ,在 软件 和 游戏 中 的 使 用 很 少 ) 以 及 BMP、PCX、TGA、TIF 


等 格式 。 


WR 


EE 
喜 
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从 入 门 到 实战 一 一 爬虫 、 游 戏 和 机 器 学 习 


Pygame 使 用 surface 对 象 来 加 载 绘制 的 图 像 。 对 于 Pygame， 加 载 图 片 使 用 pygame 
.image.load()， 给 它 一 个 文件 名 然后 就 返回 一 个 surface 对 象 。 尽 管 读 入 的 图 像 格式 不 同 ， 
但 surface 对 象 隐 藏 了 这 些 不 同 。 用 户 可 以 对 一 个 surface 对 象 进行 涂 画 、 变 形 、 复 制 等 各 
种 操作 ,事实 上 , 游戏 屏幕 也 只 是 一 个 surface, pygame.display set mode0 返 回 了 一 个 surface 
对 象 。 

对 于 任何 一 个 surface 对 象 , 可 以 用 get widthO 、get_ height0 和 gei_size() 函 数 来 获取 它 
的 尺寸 ，get_rectO 用 来 获取 它 的 区 域 形 状 。 

[ 贺 17-2 使 用 Pygame 开发 一 个 显示 坦克 自由 移动 的 游戏 窗口 。 


import pygame 

from pygame.locals import * 

import sys 

def play tank() : 
pygame.init () 


window size=(width, height)=(600, 400) # 窗 口 大 小 

speed=[1, 1] # 坦 克 运行 偏 移 量 ， 即 [水 平 ,垂直 ] ， 值 越 大 ， 移 动 越 快 
color black=(255, 255, 255) # 窗 口 背 景色 RGB 值 ( 白 色 ) 
screen=pygame.display.set mode (window size) # 设 置 窗口 模式 

pygame .display.set _caption(' 自 由 移动 的 坦克 ') # 设 置 窗口 标题 


tank image=pygame.image.load('tankU.bmp') 
# 加 载 坦克 图 片 ， 返 回 一 个 surface 对 象 


tank rect=tank image.get rect() # 获 取 坦 克 图 片 的 区 域 形状 
while True: 间 无 限 循环 
for event in pygame .event .get() : 
if event.type==pygame.QUIT: # 退 出 事件 处 理 
Pygame .quit () 
sys.exit () 


# 使 坦克 移动 ， 速 度 由 speed 变量 控制 


tank rect=tank rect .move (Speed) 


# 当 坦克 运动 出 窗口 时 重新 设置 偏 移 量 

if(tank rect.left < 0) or (tank rect.right > width) : # 水 平方 向 
speed[0]=-speed[0] # 水 平方 向 反 向 

if(tank rect.top < 0) or (tank rect.bottom > height): 间 垂 直方 向 
speed[1]=-speed[1] 垂直 方向 反 向 

screen.fill (color black) 坦 填 充 窗口 背景 

screen.blit (tank image, tank rect) # 在 窗口 指定 区 域 tank rect 上 绘制 坦克 

pygame.display.update() # 更 新 窗口 显示 内 容 

if _ name =='_ main _': 
play_tank () 


程序 运行 后 ， 可 以 看 到 白色 背景 的 游戏 窗口 ， 标 题 是 “自由 移动 的 坦克 ”， 如 图 17-3 
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图 17-3 ”自由 移动 的 坦克 游戏 窗口 


在 该 游戏 中 通过 修改 坦克 图 像 (surface 对 象 ) 区 域 的 left 属性 (可 以 认为 是 x 坐标 )、 
surface 对 象 的 top 属性 (可 以 认为 是 y 坐标 ) 改变 坦克 位 置 ， 从 而 显示 出 坦克 自由 移动 的 
效果 。 在 窗口 (窗口 也 是 surface 对 象 ) 使 用 的 blit0 函 数 上 绘制 坦克 图 像 ， 最 后 注意 需要 
更 新 窗口 显示 内 容 。 

设置 fpsClock 变量 的 值 即 可 控制 游戏 速度 ， 语 法 如 下 : 


fpsClock=pygame .time.Clock() 


在 无 限 循环 中 写 入 fpsClock.tick(50)， 可 以 按 指定 帧 频 50 更 新 游戏 画面 〈 即 每 秒 钟 刷 
新 50 次 屏幕 )。 

四 Pygame 的 图 形 绘制 

在 屏幕 上 绘制 各 种 图 形 时 使 用 pygame.draw 模块 中 的 一 些 函数 ， 事 实 上 Pygame 可 以 
不 加 载 任何 图 片 ， 而 使 用 图 形 来 制作 一 个 游戏 。 

pygame.draw 中 函数 的 第 1 个 参数 总 是 一 个 surface， 然 后 是 颜色 ， 接 着 是 一 系列 的 坐 
标 等 。 对 于 计算 机 中 的 坐标 ，(0,0) 代 表 左 上 角 ， 水 平 向 右 为 X 轴 的 正方 向 ,垂直 向 下 为 Y 
轴 的 正方 向 。 该 函数 的 返回 值 是 一 个 rect 对 象 ， 包 含 了 绘制 的 区 域 ， 这 样 就 可 以 很 方便 地 
更 新 那个 部 分 了 。pygame.draw 中 的 函数 如 表 17-3 所 示 。 


表 17-3 pygame.draw 中 的 函数 


绘制 线 
绘制 一 系列 的 线 
绘制 一 根 平滑 的 线 

绘制 一 系列 平滑 的 线 


polygon0) 绘制 多 边 形 (3 个 及 3 个 以 上 的 边 ) 
circle() | 绘制 贺 

ellipse(O) | 绘制 椭圆 
arc() 绘制 圆 弧 


下 面 详 细 说 明 pygame.draw 中 各 个 函数 的 使 用 。 
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1) pygame.draw.rectO 

格式 : pygame.draw.rect(surface, colorrecbwidth=0) 

pygame.draw.rect0 在 surface 上 画 一 个 矩形 ， 除 了 surface 和 color 以 外 ，rect 接受 一 个 
和 矩形 的 坐标 和 线 宽 参数 ， 如 果 线 宽 是 0 或 省 略 ， 则 填充 。 

2) pygame.draw.polygon0 

格式 : pygame.draw.polygon(surface, color pointlist width=0) 

polygon0 用 于 画 多 边 形 ， 其 用 法 类 似 于 rect0， 与 rect0 的 第 1、 第 2、 第 4 个 参数 都 是 
相同 的 ， 只 不 过 polygon0 会 接受 一 系列 坐标 的 列表 ， 代 表 了 各 个 顶点 的 坐标 。 

3) pygame.draw.circle0 


格式 : pygame.draw.circle(surface, color pos, radius, width=0) 
circle0 用 于 画 一 个 圆 ， 它 接受 一 个 圆心 坐标 和 半径 参数 。 
4) pygame.draw.ellipse0 


格式 : pygame.draw.ellipse(surface, color rect width=0) 
用 户 可 以 把 ellipse 想象 成 一 个 被 压 扁 的 圆 ， 事 实 上 ， 它 可 以 被 一 个 矩形 装 起 来 。 
pygame.draw.ellipse0 的 第 3 个 参数 就 是 这 个 椭圆 的 外 接 矩 形 。 

5) pygame.draw.arc() 


格式 : pygame.draw.arc(surface.colorrectstart_angle.stop_angle,width=1) 

arc 是 椭圆 的 一 部 分 ， 所 以 它 的 参数 比 椭 圆 多 一 点 。 但 是 它 是 不 封闭 的 ， 因此 没有 fill0 
方法 。start_angle 和 stop_angle 为 开始 和 结束 的 角度 。 

6) pygame.draw.line() 


格式 : pygame.draw.line(surface,color,start_pos,end pos,width=1) 
line0 用 于 画 一 条 线段 ，start pos、end_pos 是 线段 起 点 和 终点 坐标 。 
7) pygame.draw.lines() 


格式 : pygame.draw.lines(surface,color,closed,pointlist,width=1) 
closed 是 一 个 布尔 变量 ， 指 明 是 否 需要 多 画 一 条 线 来 使 这 些 线条 闭合 〈 这 样 就 和 
polygon 一 样 了 )，pointlist 是 一 个 顶点 坐标 的 数组 。 


17.2.3 ”Pygame 的 键盘 和 鼠标 事件 的 处 理 


所 谓 事件 ， 就 是 程序 上 发 生 的 事 。 例 如 用 户 按键 盘 上 的 某 个 键 或 是 单 击 、 移 动 鼠标 。 

对 于 这 些 事件 ， 游 戏 程序 需要 做 出 反应 。 在 例 17-2 中 ， 程 序 会 一 直 运行 下 去 ， 直 到 用 户 关 
闭 窗 口 而 产生 了 一 个 QUIT 事件 ，Pygame 会 接收 用 户 的 各 种 操作 (例如 按键 盘 上 的 键 、 移 
动 鼠 标 等 ) 产生 事件 。 事件 随时 可 能 发 生 ， 而 且 量 可 能 会 很 大 ，Pygame 的 做 法 是 把 一 系列 
事件 存放 到 一 个 队列 里 逐个 处 理 。 

在 例 17-2 中 使 用 了 pygame.event.get() 来 处 理 所 有 事件 , 如 果 使 用 pygame.event wait()， 
Pygame 会 等 到 发 生 一 个 事件 时 才 继 续 下 去 , 一般 在 游戏 中 不 太 实用 , 因为 游戏 往往 是 需要 
动态 运作 的 。Pygame 中 的 常用 事件 如 表 17-4 所 示 。 


一 


| 314 


第 17 章 基于 Pygame 的 游戏 设计 1 gl 


表 17-4 Pygame 中 的 常用 事件 


事 件 产生 途径 参数 
QUIT 户 按 下 “关闭 ”按钮 none 
ACTIVEEVENT gain、state 
KEYDOWN 键盘 被 按 下 unicode、key、mod 
KEYUP 键盘 被 放 开 key、mod 
MOUSEMOTION 鼠标 移动 pos、 rel、buttons 
MOUSEBUTTONDOWN 鼠标 被 按 下 pos、button 
MOUSEBUTTONUP 鼠标 被 放 开 pos、button 


@ Pygame 的 键盘 事件 的 处 理 


通常 用 pygame.event.get() 获 取 所 有 事件 ， 若 event.type 一 KEYDOWN， 这 时 是 键盘 事 


件 ， 再 判断 按键 event.key 的 种 类 ( 即 K_a、K_b、K_LEFT 这 种 形式 )。 用 户 也 可 以 使 


pygame.key.get_pressed() 获 取 所 有 被 按 下 的 键 值 , 它 会 返回 一 个 元 组 ,这 个 元 组 的 索引 就 是 


键 值 ， 对 应 的 就 是 键 是 否 被 按 下 。 


pressed keys=pygame .key.get pressed () 
if pressed keys[K SPRCE] : 

# 空 格 键 被 按 下 

fire ()# 发 射 子弹 


在 key 模块 下 有 很 多 函数 。 


。 key.get focused0: 返回 当前 的 Pygame 窗口 是 否 被 激活 。 


。 key.get pressed0: 获得 所 有 按 下 的 键 值 。 
。 key.get_ mods0: 按 下 的 组 合 键 (Alt、Ctrl、Shift)。 


。keyset mods0: 模拟 按 下 组 合 键 的 效果 (KMOD_ALT、KMOD CTRL、KMOD_ 


SHIFT )。 


[ 贺 17-3 使 用 Pygame 开发 一 个 由 用 户 控制 坦克 移动 的 游戏 。 在 例 17-2 的 基础 上 
增加 通过 方向 键 控制 坦克 运动 的 功能 ， 并 为 游戏 增加 背景 图 片 。 程 序 的 运行 效果 如 图 17-4 


所 示 。 
import os 
import sys 
import pygame 
from pygame.locals import * 


def control tank (event): # 控 制 坦克 运动 函数 
speed=[zx,y]=[0, 0] # 相 对 坐标 
speed offset=1 # 速 度 
# 当 方向 键 被 按 下 时 进行 位 置 计算 


if event.type==pygame .KEYDOWN: 
if event.key==pygame.K LEFT: 
speed[0]-=speed offset 
if event .key==pygame.K RIGHT: 
speed[0]=speed offset 
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if event .key==pygame-K_UP: 
speed[1]-=speed offset 
if event .key==pygame.K DOWN: 
speed[1]=speed offset 
# 当 方向 键 被 释放 时 相对 偏 移 为 0， 即 不 移动 
if event .type in (pygame.KEYUP, pygame.K LEFT, pygame.K RIGHT, pygame 
.K DOWN) 
speed=[0, 0] 
return speed 
def Play tank(): 
pygame.init () 


window size=Rect (0, 0, 600, 400) # 窗 口 大 小 
speed=[1, 1] # 坦 克 运 行 偏 移 量 ， 即 [水 平 , 垂直] ， 值 越 大 ， 移 动 越 快 
color Dlack (255, 255, 255) # 窗 口 背 景色 RGB 值 白色) 


screen=pygame.display.set mode (window size.size) # 设 置 窗口 模式 
pygame .display.set _caption(' 用 户 方向 键 控制 坦克 移动 ') “埋设 置 窗口 标题 


tank image=pygame.image.1load('tankU.bmp') # 加 载 坦克 图 片 
# 加 载 窗口 背景 图 片 
back image=pygame.image.load('back image.jpg') 
tank rect=tank image.get rect() # 获 取 坦 克 图 片 的 区 域 形状 
while True: 
# 退 出 事件 处 理 
for event in pygame .event.get() : #pygame .event .get () 获取 事件 序列 


if event .type==pygame .QUIT: 
Pygame .quit () 
sys.exit () 
# 使 坦克 移动 ， 速 度 由 speed 变量 控制 
cur speed=control tank (event) 
#rect 的 clamp () 方法 使 移动 范围 限制 在 窗口 内 


tank rect=tank rect.move (CUT speed) .clamp (window size) 


screen.blit (back image, (0, 0)) # 设 置 窗口 背景 图 片 
screen.blit (tank image,tank rect) # 在 窗口 上 绘制 坦克 
Pygame.display.update() # 更 新 窗口 显示 内 容 
if _ name ==' main _': 
play_tank () 


当 用 户 按 下 方向 键 ， 计 算出 相对 位 置 cur_speed 后 ， 使 用 tank_rect.move(cur_speed) 函 
数 向 指定 方向 移动 坦克 。 当 释放 方向 键 时 坦克 停止 移动 。 
@ Pygame 的 鼠标 事件 的 处 理 
pygame .mouse 的 函数 如 下 。 
。 pygame.mouse.get_pressed(): 返回 按键 的 按 下 情况 ， 返 
中 键 、 右 键 ， 如 果 被 按 下 则 为 True。 


互 


的 是 一 元 组 ， 分 别 为 左 键 、 
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图 17-4 用 方向 键 控制 坦克 运动 的 游戏 窗口 


。 pygame.mouse.get rel0: 返回 相对 偏 移 量 ， 即 (x 方向 偏 移 量 ，y 方向 偏 移 量 ) 的 一 
元 组 。 

。 pygame.mouse.get_pos(): 返回 当前 鼠标 位 置 (x, y)。 

例如 “x, y= pygame.mouse.get_pos()” 用 于 获取 鼠标 位 置 。 

。 pygame.mouse.set_pos(): 设置 鼠标 位 置 。 

。 pygame.mouse.set_visible(): 设置 鼠标 光标 是 否 可 见 。 

。 pygame.mouse.get_focused(): 如 果 鼠 标 在 Pygame 窗口 内 有 效 ， 返 回 True。 

。 pygame.mouse.set_cursor(): 设置 鼠标 的 默认 光标 样式 。 

。 pygame.mouse.get_cursor(): 返回 鼠标 的 光标 样式 。 

[ 辑 17-4 演示 鼠标 事件 处 理 的 程序 ， 运 行 效果 如 图 17-5 所 示 。 


import pygame 
from pygame.locals import * 


from sys import exit 
from random import * 
from math import pi 
pygame.init () 
screen=pygame.display.set mode((640, 480), 0, 32) 
points=[] 
while True: 
for event in pygame.event.get(): 
if event .type==QUIT: 
pygame.quit () 
exit() 
if event .type==KEYDOWN: 
坦 按 任意 键 可 以 清 屏 ， 并 把 点 回复 到 原始 状态 


points=[] 
screen.fill((255,255,255)) # 用 白色 填充 窗口 背景 
if event .type==MOUSEBUTTONDOWN : 鼠标 按 下 
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screen.fill((255,255,255)) 

# 画 随机 逢 形 

rc=(255,0,0) 坦 红 色 

rp=(randint (0,639), randint (0,479) ) 

rs=(639-randint (rp[0],639),479-randint (rp[1],479)) 

pygame.draw.rect (screen, rc,Rect (rp,rs)) 

# 画 随机 圆 形 

rc=(0,255, 0) # 绿 色 

rp= (randint (0,639), randint (0,479)) 

rr=randint (1,200) 

pygame.draw.circle(screen, rc, rp,rr) 

# 获 得 当前 鼠标 单 击 位 置 

zx, y=pygame .mouse.get pos () 

points.append ( (x, y)) 

# 根 据 单 击 位 置 画 弧 线 

angle= (x/639.)*pi*2. 

pygame.draw.arc(screen, (0,0,0), (0,0,639,479),0,angle, 3) 

# 根 据 单 击 位 置 画 椭圆 

pygame .draw.ellipse (screen, (0,255,0), (0,0,x,y)) 

# 从 左上 和 右 下 画 两 根 线 连接 到 单 击 位置 

pygame .draw.line (screen, (0,0,255), (0,0), (x,y)) 

pygame.draw.line (screen, (255,0,0), (640,480), (x, y)) 

# 夯 单 击 轨迹 图 

if len(points)>1: 

pygame.draw.lines (screen, (155,155,0),False,points,2) 

# 和 轨迹 图 基本 一 样 ， 只 不 过 是 闭合 的 ， 因 为 会 覆盖 ， 所 以 这 里 注释 了 

#if len (Points)>=3: 

# pygame .draw.polygon (screen, (0,155,155),points,2) 

# 把 每 个 点 画 明 显 一 点 

for p in points: 

pygame.draw.circle(screen, (155,155,155),p, 3) 

pygame.display.update() 


间 Posme window [=' Ew 


图 17-5 ”演示 鼠标 事件 处 理 的 程序 的 运行 效果 
运行 这 个 程序 ， 在 窗口 上 单 击 鼠 标 就 会 有 图 形 出 来 ， 按 任意 键 可 以 重新 开始 。 
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17.2.4 ”Pygame 的 字体 使 用 


Pygame 可 以 直接 调用 系统 字体 ， 也 可 以 调用 TTF 字体 。 为 了 使 用 字体 ， 首 先 应 该 创 
建 一 个 Font 对 象 ， 对 于 系统 自 带 的 字体 应 该 这 样 调用 : 

fontl=pygame.font.SysFont ('arial', 16) 

第 1 个 参数 是 字体 名 ， 第 2 个 参数 是 字号 。 在 正常 情况 下 系统 里 都 会 有 arial 字体 ， 如 
果 没 有 会 使 用 默认 字体 ， 默 认 字 体 和 用 户 使 用 的 系统 有 关 。 
户 可 以 使 用 pygame.font.get_fonts() 来 获取 当前 系统 所 有 的 可 用 字体 : 


>>> pygame.font.get fonts() 

'gisha', 'fzshuti', 'simsunnsimsun', 'estrangeloedessa', 

'symboltigerexpert', 'juiceitc', 'onyx', 'tiger', 'webdings', 

'franklingothicmediumcond', "edwardianscriptitc'" 

另外 还 有 一 种 调用 方法 是 使 用 自己 的 TTF 字体 : 

my_font=pygame.font.Font ("my font.ttf", 16) 

这 个 方法 的 好 处 是 可 以 把 字体 文件 和 游戏 一 起 打包 分 发 ， 避 免 玩 家 计算 机 上 没有 这 个 
字体 而 无 法 显示 的 问题 。 一 旦 有 了 Font 对 象 ， 就 可 以 用 render() 方 法 来 设置 文字 内 容 ， 然 
后 通过 blit0 方 法 写 到 屏幕 上 : 

text=font1 .render ("坦克 大 战 ", True, (0,0,0)，(255,255,255) ) 

render() 方 法 的 第 1 个 参数 是 写 入 的 文字 内 容 第 2 个 参数 是 布尔 值 ， 说 明 是 否 开启 抗 
锯齿 ， 第 3 个 参数 是 字体 本 身 的 颜色 ， 第 4 个 参数 是 背景 的 颜色 。 如 果 不 想 有 背景 色 ， 也 
就 是 让 背景 透明 ， 可 以 不 加 第 4 个 参数 。 

例如 自己 定义 一 个 文字 处 理 函 数 show_text0, 其 中 参数 surface_ handle 为 surface 句柄 ， 
pos 为 文字 显示 位 置 , color 为 文字 颜色 , font bold 为 是 否 加 粗 , font_size 为 字体 大 小 , font_ 
italic 为 是 否 斜 体 。 

def show text (surface handle, pos, text, color, font bold=False, font 

size=13, font italic=False): 


#cur font=pygame.font.SysFont ("宋体 ",，font size) # 获 取 系统 字体 

cur font=pygame.font.Font('simfang.ttf'，30) ”# 获 取 字体 ， 并 设置 文字 大 小 
cur font.set bold(font bold) # 设 置 是 否 加 粗 

cur font.set italic(font italic) ## 设 置 是 否 斜 体 

text fmt=cur font.render (text，1，color) # 设 置 文字 内 容 

surface handle.blit (text fmt, pos) # 绘 制 文字 


在 更 新 窗口 内 容 pygame.displayupdate0) 之 前 加 入 : 


text pos=u "坦克 大 战 " 
Show text (screen, (20, 220), text pos, (255, 0, 0), True) 
text_pos=u" 坦 克 位置 : ($d,%d)" $ (tank rect.left, tank rect.top) 
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Show text (Screen， (20, 420), text pos， (0, 255, 255), True) 


此 时 会 在 屏幕 上 的 (20, 220) 处 显示 红色 的 “坦克 大 战 ”文字 ,并 且 在 (20, 420) 处 显示 现 
在 坦克 所 处 位 置 的 坐标 ， 移 动 坦 克 ， 位 置 坐标 文字 同时 会 改变 。 


17.2.5 ”Pygame 的 声音 播放 


@@ Sound 对象 

在 初始 化 声音 设备 后 就 可 以 读 取 一 个 音乐 文件 到 一 个 Sound 对 象 中 。pygame.mixer 
.Sound() 接 受 一 个 文件 名 ， 也 可 以 是 一 个 文件 对 象 ， 不 过 这 个 文件 必须 是 WAV 或 者 OGG 
文件 。 


hello sound=pygame.mixer.sound ("hello.ogg") ## 建 立 Sound 对 象 
hello sound.play() # 声 音 播放 一 次 


一 旦 这 个 Sound 对 象 出 来 了 ， 就 可 以 使 用 play() 来 播放 它 。play(loop, maxtime) 可 以 接 
受 两 个 参数 ，loop 是 重复 的 次 数 〈 取 1 是 两 次 ， 注 意 是 重复 的 次 数 而 不 是 播放 的 次 数 )， 
-1 意味 着 无 限 循环 ，maxtime 是 指 多 少 毫 秒 后 结束 。 

若 不 使 用 任何 参数 调用 ， 意 味 着 把 这 个 声音 播放 一 次 。 一 旦 play() 方 法 调用 成 功 ， 就 
会 返回 一 个 Channel 对 象 ， 否 则 返回 一 个 None。 

四 music 对 象 

在 Pygame 中 还 提供 了 pygame.mixer.music 类 来 控制 背景 音乐 的 播放 。pygame 
.mixer.music 用 来 播放 MP3 和 OGG 音乐 文件 , 不 过 MP3 并 不 是 所 有 的 系统 都 支持 (Linux 
默认 就 不 支持 MP3 播放 )。 用 户 可 以 用 pygame.mixer.music.load() 加 载 一 个 文件 ， 然 后 使 用 
pygame.mixer.music.play() 播 放 ， 不 放 的 时 候 就 用 stop0 方 法 停止 ， 当 然 也 有 类 似 录 影 机 上 
的 pause0 和 unpause() 方 法 。 

4 加 载 冰 景 音乐 


pygame .mixer.music.load ("hello.mp3") 


pygame .mixer.music.set volume (music volume/100.0) 
# 循 环 播放 ， 从 音乐 的 第 30 秒 开始 

pygame .mixer.music.play(-1, 30.0) 

在 游戏 退出 事件 中 加 入 停止 音乐 播放 的 代码 : 

# 停 止 音乐 播放 

pygame .mixer.music.stop () 

mnusic 对 象 提供 了 丰富 的 函数 方法 ， 下 面 分 别 介绍 。 

1 ) pygame.mixer.music.load() 

功能 : 加 载 音乐 文件 。 


格式 : pygame.Imixermnusic.load(filename) 


2) pygame.mixer.music.play() 


功能 : 播放 音乐 。 
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格式 : pygame.mixer.music.play(loops=0,start=0.0) 
其 中 ，loops 表示 循环 次 数 ， 如 果 设 置 为 -1， 表 示 不 停 地 循环 播放 ， 如 果 loops 为 5， 则 播 
放 5+1=6 次 ; start 参数 表示 从 音乐 文件 的 哪 一 秒 开始 播放 ， 设 置 为 0 表示 从 开始 完整 
播放 。 

3) pygame.mixer.music.rewind() 
功能 : 重新 播放 。 


格式 : pygame.mixer.music.rewind() 


4) pygame.mixer.music.stop() 
功能 : 停止 播放 。 

格式 : pygame.mixer.music.stop() 
5) pygame.mixer.music.pause() 
功能 : 暂停 播放 。 


格式 : pygame.mixer.music.pause() 


户 可 通过 pygame.mixer.music.unpause() 恢 复 播放 。 
6) pygame.mixer.music.set_volume() 
功能 :设置 音量 。 
格式 : pygame.mixer.music.set_volume(value) 
其 中 ，value 的 取 值 为 0.0 一 1.0。 
7) pygame.mixer.music.get_pos() 
功能 :获取 当前 播放 了 多 长 时 间 。 
格式 : pygame.mixer.music.get_pos(): retum time 


17.2.6 ”Pygame 的 精灵 使 用 


pygame.sprite.Sprite 是 Pygame 中 用 来 实现 精灵 的 一 个 类 , 在 使 用 时 并 不 需要 对 它 实例 
化 ， 只 需要 继承 它 ， 然 后 按 需 写 出 自己 的 类 ， 因 此 非常 简单 、 实 用 。 

@ 精灵 

精灵 可 以 被 认为 是 一 个 个 小 图 片 〈 帧 ) 序列 (例如 和 信物 行走 )， 它 可 以 在 屏幕 上 移动 ， 
并 且 可 以 与 其 他 图 形 对 象 交 互 。 精 灵图 像 可 以 是 使 用 Pygame 绘制 形状 函数 绘制 的 形状 ， 
也 可 以 是 图 像 文 件 。 图 17-6 所 示 为 由 16 帧 图 片 组 成 的 人 物 行 走 序列 。 

@ Sprite 类 的 成 员 

pygame.sprite.Sprite 用 来 实现 精灵 类 ，Sprite 的 数据 成 员 和 函数 方法 主要 如 下 。 

1) selfimage 
其 负责 显示 什么 图 形 ， 例 如 selfimage=pygame.Surface([x.y]) 说 明 该 精灵 是 一 个 xxy 大 
小 的 矩形 ，selfimage=pygame.image.load(filename) 说 明 该 精灵 显示 flename 这 个 图 片 文件 。 

selfimage.fill([color]) 负 责 对 selfimage 着 色 ， 例 如 : 


self.image=pygame.Surface ([zx,y]) 
self.image.fill([255,0,0]) # 对 xxy 大 小 的 矩形 填充 红色 
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图 17-6 精灵 图 片 序列 


2) selfrect 
其 负责 在 哪里 显示 ,一 般 来 说 , 先 用 self.rect=selfimage.get_rect() 获 取 image 矩形 大 小 ， 


然后 给 selfrect 设 定 显示 的 位 置 ， 一 般 用 selfrecttopleft 确定 左上 角 的 显示 位 置 ， 当 然 也 可 


以 


topright、bottomright、bottomleft 分 别 确定 其 他 几 个 角 的 位 置 。 

另外 ，selfrecttop、selfrectbottom、selfrectleft、selfrectright 分 别 表 示 上 、 下 、 左 、 右 。 
3) self.update() 

其 负责 使 精灵 行为 生效 。 

4) Sprite.add() 

添加 精灵 到 groups 中 
5) Sprite.remove() 
从 精灵 组 groups 中 删除 。 
6) Sprite.kill() 
从 精灵 组 groups 中 删除 全 部 精灵 。 

7) Sprite.alive() 

判断 某 个 精灵 是 否 属于 精灵 组 groups。 

@ 建立 精灵 

所 有 精灵 在 建立 时 都 是 从 pygame.sprite.Sprite 中 继承 的 , 建立 精灵 要 设计 自己 的 精灵 类 。 
[ 贺 17-5 建立 Tank 精灵 。 


import pygame,sys 

pygame .init() 

class Tank (pygame.sprite.Ssprite): 

def init _ (self,filename,initial position): 

pygame.sprite.sprite. init _(self) 
self.image=pygame.image.1load (filename) 
self.rect=self.image.get rect() # 获 取 self .image 的 大 小 
#self.rect.topleft=initial position # 确 定 左 上 角 的 显示 位 置 
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self.rect.bottomright=initial position # 右 下 角 的 显示 位 置 是 [150,1001] 


screen=pygame.display.set mode([640,480]) 
screen.fill([255,255,255]) 
fi="'tankU .jpg’' 
b=Tank (fi, [150,100]) 
while True: 
for event in pygame.event.get(): 
if event .type==pygame.QUIT: 
sys.exit () 
screen.blit (b.image,b.rect) 
pygame.display.update() 


[一 17-6 使 用 图 17-6 所 示 的 精灵 图 片 序列 建立 动画 效果 的 人 物 行走 精灵 。 
在 游戏 动画 中 ， 人 物 行走 是 基本 动画 ， 在 精灵 中 不 断 切 换 人 物 行走 图 片 ， 从 而 达到 动 
画 的 效果 。 


import pygame 
from pygame.locals import * 


class MySprite (pygame.sprite.sprite): 
def init (self, target): 

pygame.sprite.Ssprite. init _(self) 
self.target surface=target 
self.image=None 
self.master image=None 
self.rect=None 
self.topleft=0,0 
self.frame=0 
self.old frame=-1 
self.frame width=1 
self.frame height=1 


self.first frame=0 # 第 1 帧 序号 
self.1last frame=0 # 最 后 一 帧 序号 
self.columns=1 # 列 数 


self.last time=0 


在 加 载 一 个 精灵 图 片 序列 的 时 候 需 要 告知 程序 一 帧 的 大 小 〈 传 入 帧 的 宽度 和 高 度 以 及 
文件 名 和 列 数 )。 


def load(self, filename, width, height, columns): 


self.master image=pygame.image.1load (filename) .convert alpha() 
self.frame width=width 

self.frame height=height 

self.rect=0, 0,width,height 

self.columns=columns 


rect=self .master image -get rect() 
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self.last frame=(rect.width//width)*(rect.height//height)-1 


一 个 循环 动画 通常 是 这 样 工作 的 : 从 第 1 帧 开始 不 断 地 加 载 直到 最 后 一 帧 ， 然 后 再 返 
第 1 帧 ， 并 不 断 重 复 这 个 操作 。 
但 是 如 果 只 是 这 样 做 ， 程 序 会 一 股 脑 地 将 动画 播放 完 ， 这 里 想 让 它 根据 时 间 间 隔 一 张 
一 张 地 播放 ， 因 此 加 入 定时 的 代码 ， 将 帧 速率 ticks 传递 给 Sprite 的 update0 函 数 ， 这 样 就 
可 以 轻松 地 让 动画 按照 由 速率 来 播放 。 
def update(self, current time, rate=60): 
if current time>self.last time + rate: # 如 果 时 间 超 过 上 次 时 间 +60 毫秒 


互 


Tt 


te 


self.frame+=1 # 帧 号 加 1， 意 味 着 显示 下 一 帧 图 像 
if self.frame>self.last frame: # 帧 号 超过 最 后 一 帧 
self.frame=self.first _ frame 坦 回 到 第 1 帧 


self.last time=current time 
if self.frame!=self.old frame: 
# 首 先 需 要 计算 单个 帧 左上 角 的 x、y 位 置 值 
frame x=(self.frame % self.columns) * self. frame width 
frame y=(self.frame // self.columns) * self.frame height 
# 然 后 将 计算 好 的 x, y 值 传递 给 位 置 属性 
rect=(frame x, frame y, self.frame width, self.frame height) 
# 要 显示 区 域 
self.image=self.master image.subsurface (rect) 


# 截 取 要 显示 区 域 图 像 


self.old frame=self.frame 
pygame.init () 
screen=pygame.display.set mode((800,600),0,32) 
pygame .display.set caption ("精灵 类 测试 ") 
font=pygame.font.Font (None, 18) 
# 启 动 一 个 定时 器 ， 然 后 调用 tick (num) 函数 就 可 以 让 游戏 以 num 帧 来 运行 
framerate=pygame .time.Clock() 
cat=MySprite (Screen) 
cat.load("sprite2.png", 92, 95, 4) # 精 灵图 片 ， 每 帧 92x95 大 小 ， 共 4 列 
group=pygame .sprite.Group() 
group.add (cat) 
while True: 
framerate.tick(10) # 指 定 帧 速率 
ticks=pygame.time.get ticks() # 获 取 运 行 时 间 
for event in pygame.event.get(): 
if event .type==pygame .QUIT : 
PYgame-gquit() 
exXit() 
key=pygame .key-get pressed () 
if key[pygame.K ESCAPE]: #Esc 键 
exXit() 
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screen.fill((0,0,100)) 

#cat .draw (screen) 坦 没有 此 方法 
cat .update (ticks) 

screen.blit (cat.image,cat.rect) 

#group.update (ticks) 

#group.draw (screen) 

pygame.display.update() 


运行 后 可 见 一 个 人 物 行走 动画 ,用户 也 可 以 使 用 精灵 组 的 update0 和 draw0 函 数 实现 精灵 
动画 。 
group.update (ticks) 
# 将 帧 速率 ticks 传递 给 sprite 的 update () 函数 ， 让 动画 按照 帧 速率 来 播放 


group.draw (screen) 


@@ 建立 精灵 组 

当 程序 中 有 大 量 实体 的 时 候 ， 操 作 这些 实 体 将 会 是 一 件 相当 麻烦 的 事 ， 那 么 有 没有 什 
么 容器 可 以 将 这 些 精 灵 放 在 一 起 统一 管理 呢 ? 答案 就 是 使 用 精灵 组 。 

Pygame 使 用 精灵 组 来 管理 精灵 的 绘制 和 更 新 ， 精 灵 组 是 一 个 简单 的 容器 。 

使 用 pygame.sprite.Group() 函 数 可 以 创建 一 个 精灵 组 : 


group=pygame. sprite.Group() 
group.add (sprite one) 


精灵 组 也 有 update0 和 draw0 〇 函数 : 


group .update () 
group .draw() 


Pygame 还 提供 了 精灵 与 精灵 之 间 的 冲突 检测 、 精 灵 与 组 之 间 的 碰撞 检测 , 这些 碰撞 检 
测 技术 在 17.4 节 的 飞机 大 战 游戏 中 要 使 用 。 

@ 精灵 与 精灵 之 问 的 碰撞 检测 

1) 两 个 精灵 之 间 的 矩形 检测 

在 只 有 两 个 精灵 的 时 候 可 以 使 用 pygame.sprite.collide_rect() 函 数 进行 一 对 一 的 冲突 检 
测 。 这 个 函数 需要 传递 两 个 精灵 ， 并 且 每 个 精灵 都 需要 继承 自 pygame.sprite.Sprite。 

这 里 举 个 例子 : 


spirte 1=MySprite ("sprite 1.png",200,200,1) 
#MySprite 是 例 17-6 创建 的 精灵 类 


sprite 2=MySprite ("sprite 2.png",50,50,1) 
result=pygame.sprite.collide rect(sprite 1,sprite 2) 
if result: 


print ("精灵 碰撞 上 了 ") 

2) 两 个 精灵 之 间 的 圆 检 测 
和 矩形 冲突 检测 并 不 适用 于 所 有 形状 的 精灵 , 因此 在 Pygame 中 还 提供 了 圆 形 冲突 检测 。 
pygame.sprite.collide_circle() 函 数 是 基于 每 个 精灵 的 半径 值 来 进行 检测 的 ， 用 户 可 以 自己 指 
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定 精灵 半径 ， 或 者 让 函数 计算 精灵 半径 。 


result=pygame.sprite.collide circle(sprite 1,sprite 2) 


if result: 
print ("精灵 碰撞 上 了 ") 

3) 两 个 精灵 之 间 的 像素 遮 罩 检测 

如 果 和 矩形 检测 和 圆 形 检测 都 不 能 满足 需求 ,Pygame 还 为 用 户 提供 了 一 个 更 加 精确 的 检 
测 一 —pygame.sprite.collide_mask()。 

这 个 函数 接受 两 个 精灵 作为 参数 ， 返 回 值 是 一 个 bool 变量 。 

if pygame.sprite.collide mask (sprite 1,sprite 2): 

print ("精灵 碰撞 上 了 ") 

4) 精灵 和 组 之 间 的 矩形 冲突 检测 

在 调用 pygame.sprite.spritecollide(sprite,sprite_group,bool) 函 数 的 时 候 , 一 个 组 中 的 所 有 
精灵 都 会 逐个 地 对 另外 一 个 单个 精灵 进行 冲突 检测 ,发 生 冲 突 的 精灵 会 作为 一 个 列表 返回 。 
这 个 函数 的 第 1 个 参数 是 单个 精灵 ， 第 2 个 参数 是 精灵 组 ， 第 3 个 参数 是 一 个 bool 
值 ， 最 后 这 个 参数 起 了 很 大 的 作用 ， 当 为 True 的 时 候 会 删除 组 中 所 有 冲突 的 精灵 ， 当 为 
False 的 时 候 不 会 删除 冲突 的 精灵 。 
list collide=pygame.sprite.spritecollide (sprite, sprite _ group,False) 
另外 ， 这 个 函数 还 有 一 个 变 体 一 pygame.sprite.spritecollideany()， 这 个 函数 在 判断 精 
灵 组 和 单个 精灵 冲突 的 时 候 会 返回 一 个 bool 值 。 
5) 精灵 组 之 间 的 矩形 冲突 检测 
利用 pygame.sprite.groupcollide() 函 数 可 以 检测 两 个 组 之 间 的 冲突 , 它 返 回 一 个 字典 ( 键 
值 对 )。 

以 上 学 习 了 几 种 常用 的 冲突 检测 函数 ， 下 面 在 游戏 实例 中 实际 运用 这 些 函数 。 


17.3 ”基于 Pygame 设计 贪 吃 蛇 游 戏 


贪 吃 蛇 游戏 通过 玩家 控制 蛇 移 动 ， 不 断 吃 到 食物 〈 红 色 草莓 ) 增长 ， 直 到 蛇 身 碰 到 边 
界 游戏 结束 。 其 运行 效果 如 图 17-7 所 示 。 


import pygame, sys, time, random 
from pygame.locals import * 


输入 下 面 的 两 行 来 启用 Pygame， 这 样 Pygame 在 该 程序 中 就 可 以 用 了 : 


pygame .init () 


fpsClock=pygame .time.Clock() 


第 1 行 告 诉 Pygame 初始 化 ， 第 2 行 创建 一 个 名 为 fpsClock 的 变量 ， 该 变量 用 来 控制 
游戏 的 速度 。 然 后 用 下 面 的 两 行 代码 新 建 一 个 Pygame 显示 层 〈 游 戏 元 素 画 布 )。 
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I "Ds = | 


F 
加 Raspberry Snake 


playSurface=pygame.display.set mode((640, 480)) 
pygame .display.set caption('Raspberry Snake') 


接 下 来 定义 一 些 颜色 ， 虽 然 这 一 步 并 不 是 必需 的 ， 但 它 会 减少 代码 量 。 下 面 的 代码 定 
义 了 程序 中 用 到 的 颜色 : 

redColour=pygame.Color (255, 0, 0) 

blackColour=pygame.Color (0, 0, 0) 


whiteColour=pygame.Color (255, 255, 255) 
greyColour=pygame .Color (150, 150, 150) 


下 面 的 几 行 代码 初始 化 了 程序 中 用 到 的 一 些 变量 ， 这 是 很 重要 的 一 步 ， 因 为 如 果 游 戏 


开始 时 这 些 变量 为 空 ，Python 将 无 法 正常 运行 。 
snakePosition=[100,100] # 蛇 头 位 置 
snakeSegments=[[100,100], [80,100], [60,100]] # 蛇 身 序列 
raspberryPosition=[300,300] # 草 莓 位 置 
raspberrySpawned=1 # 是 否 吃 到 草莓 ，1 为 没有 吃 到 ，0 为 吃 到 
direction='right' # 运 动 方向 ， 初 始 向 右 


changeDirection=direction 


此 时 可 以 看 到 变量 snakePosition、snakeSegments 和 raspberryPosition 被 设置 为 用 逗号 
分 隔 的 列表 。 

用 下 面 几 行 代码 来 定义 gameOver() 函 数 : 

def gameOver () : 


gameOverFont=pygame.font.Font ('freesansbold.ttf"', 72) 


gameOverSurf=gameOverFont .render('Game Over', True, greyColour) 


327 | 


| 区 要 项 目 案例 开发 
从 入 门 到 实战 一 一 爬虫 、 游 戏 和 机 器 学 习 


gameOverRect=gameOverSurf.get rect() 
gameOverRect .midtop=(320, 10) 


playSurface.blit (gameOverSurf, gameOverRect) 


pygame .display.flip() 
time.sleep (5) 

pygame .quit () 
sys.exit () 


gameOver() 函 数 用 了 一 些 Pygame 命令 来 完成 一 个 简单 的 任务 : 用 大 号 字体 将 Game 
Over 打印 在 屏幕 上 ， 停 留 $ 秒 钟 ， 然 后 退出 Pygame 和 Python 程序 。 在 游戏 开始 之 前 就 定 
义 了 结束 函数 ， 这 看 起 来 有 点 奇怪 ， 但 是 所 有 的 函数 都 应 该 在 被 调用 前 定义 。Python 是 不 


会 自己 执行 gameOver() 函 数 的 ， 直 到 用 户 调用 该 函数 。 


至 此 程序 的 开头 部 分 已 经 完成 , 接 下 来 进入 主要 部 分 。 该 程序 运行 在 一 个 无 限 循环 (一 
个 永 不 退出 的 while 循环 ) 中， 直到 蛇 撞 到 了 墙 或 者 自己 才 会 结束 游戏 。 首 先 用 下 面 的 代 


码 开始 主 循环 : 


while True: 


没有 其 他 的 比较 条 件 ，Python 会 检测 True 是 否 为 真 。 如 果 True 一 直 为 真 ， 循 环 会 一 
直 进 行 ， 直 到 用 户 调用 gameOver0 函 数 告 诉 Python 退出 该 循环 。 


for event in pygame.event.get(): 
if event.type==QUIT: 
pygame .quit () 
sys.exit () 
elif event .type==KEYDOWN: 
elif event .type==KEYDOWN: 


if event.key==K RIGHT or event.key==ord('d'): 


changeDirection="'right' 


if event.key==K LEFT or event.key==ord('a'): 


changeDirection='left'" 


if event .key==K UP or event .key==ord('w') : 


changeDirection='up' 


if event .key==K DOWN or event .key==ord('s') : 


changeDirection='down'" 
if event .key==K ESCAPE: 


pygame .event .post (pygame .event .Event (QUIT) ) 


for 循环 用 来 检测 按键 等 Pygame 事件 。 


第 1 个 检测 寺 event.type == QUIT 告诉 Python 如 果 Pygame 发 出 了 QUIT 信息 ( 当 用 户 


按 下 Esc 键 时 )， 执行 下 面 缩 进 的 代码 。 之 后 的 两 行 类 似 gameOver0 函 数 ， 通 知 Pygame 和 


Python 程序 结束 并 退出 。 


第 2 个 检测 以 el 站 开头 的 行 用 来 检测 Pygame 是 否 发 出 KEYDOWN 事件 ,该 事件 在 用 


户 按 下 键盘 时 产生 。 
KEYDOWN 事件 修改 变量 changeDirection 的 值 ， 该 变量 月 
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日 于 


F 控 制 蛇 的 运动 方向 。 在 


本 例 中 提供 了 两 种 控制 蛇 的 方法 ， 
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即 用 鼠标 或 者 键盘 上 的 W、D、A、S 键 让 蛇 向 上 、 右 、 


下 、 左 移动 。 程 序 开始 时 ， 蛇 会 按照 changeDirection 预 设 的 值 向 右 移动 ， 直 到 用 户 按 下 键 


盘 改 变 其 方向 


在 程序 开始 的 初始 化 部 分 有 一 个 叫 direction 的 变量 , 这 个 变量 协同 changeDirection 检 


测 用 户 发 出 的 命令 是 否 有 效 。 蛇 不 应 该 立即 向 后 运动 (如 果 发 生 该 情况 ， 蛇 会 死亡 ， 同 时 


游戏 结束 )。 为 了 防止 这 样 的 情况 发 生 ， 将 用 户 发 出 的 请 求 〈 保 存在 changeDirection 里 ) 


和 目前 的 方向 (保存 在 direction 里 


) 进行 比较 ， 如 果 方 向 相反 ， 和 忽略 该 命令 ， 蛇 会 继续 按 


原 方向 运动 。 这 里 用 下 面 几 行 代码 进行 比较 : 


if changeDirection=='right' and not direction=='left': 


direction=changeDi 


rection 


if changeDirection=='left' and not direction=="'right': 


direction=changeDi 


rection 


if changeDirection=='up' and not direction=='down' : 


direction=changeDi 


rection 


if changeDirection=='down' and not direction=='up': 


direction=changeDi 


rection 


这 样 就 保证 了 用 户 输入 的 合法 性 ， 蛇 在 屏幕 上 显示 为 一 系列 块 ) 就 能 够 按照 用 户 的 
输入 移动 。 每 次 转弯 时 ， 蛇 都 会 向 该 方向 移动 一 小 节 。 每 个 小 节 为 20 像素 ， 用 户 可 以 告诉 


Pygame 在 任何 方向 移动 一 小 节 。 


if direction=='right': 
snakePosition[0]+=20 
if direction=='left': 
snakePosition[0]-=20 
if direction=='up': 
snakePosition[1]-=20 
if direction=='down' : 
snakePosition[1]+=20 


snakePosition 为 蛇 头 的 新 位 置 ， 


程序 开始 处 的 另 一 个 列表 变量 snakeSegments 却 不 是 这 


样 。 该 列表 存储 蛇 身体 的 位 置 〈 头 部 后 边 )， 随 着 蛇 吃 掉 草 莓 导致 长 度 增 加 ， 列 表 会 增加 长 
度 同 时 提高 游戏 难度 。 随 着 游戏 的 进行 ， 避 免 蛇 头 撞 到 身体 的 难度 变 大 。 如 果 蛇 头 撞 到 身 


体 ， 蛇 会 死亡 ， 同 时 游戏 结束 。 此 办 


用 下 面 的 代码 使 蛇 的 身体 增长 : 


snakeSegments.insert (0,1ist (snakePosition)) 

这 里 用 insert() 方 法 向 snakeSegments 列表 ( 存 有 蛇 当前 的 位 置 ) 中 添加 新 项 目 。 每 当 
Python 运行 到 这 一 行 ， 它 就 会 将 蛇 的 身体 增加 一 节 ， 同 时 将 这 一 节 放 在 蛇 的 头 部 ， 在 玩家 
看 来 蛇 在 增长 。 当 然 ， 用 户 只 希望 蛇 吃 到 草莓 时 才 增 长 ， 否 则 蛇 会 一 直 变 长 。 输 入 下 面 的 


几 行 代码 : 


if snakePosition[0]==raspberryPosition[0] 


and snakePosition[1]==raspberryPosition[1]: 


raspberrySpawned=0 
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else: 


snakeSegments-pop () 


第 1 条 于 语句 检查 蛇 头 部 的 x 和 y 坐标 是 否 等 于 草莓 〈 玩 家 的 目标 点 ) 的 坐标 。 如 果 
等 于 ， 该 草莓 就 会 被 蛇 吃 掉 ， 同 时 raspberrySpawned 变量 置 为 0。else 语句 告诉 Python 如 
果 草 莓 没有 被 吃 掉 ， 将 snakeSegments 列表 中 最 早 的 项 目 pop 出 来 。 

pop 语句 简单 、 易 用 ， 它 返回 列表 中 末尾 的 项 目 并 从 列表 中 删除 ， 使 列表 缩短 一 项 。 
在 snakeSegments 列表 里 ， 它 使 Python 删 掉 距 离 头 部 最 远 的 一 部 分 。 在 玩家 看 来 ， 蛇 整体 
在 移动 而 不 会 增长 。 实 际 上 ， 它 在 一 端 增加 小 节 ， 在 另 一 端 删除 小 节 。 由 于 有 else 语句 ， 
pop 语句 只 有 在 没 吃 到 草莓 时 执行 。 如 果 吃 到 了 草莓 ， 列 表 中 的 最 后 一 项 不 会 被 删 掉 ， 所 
以 蛇 会 增加 一 小 节 。 

现在 , 蛇 就 可 以 通过 吃 草莓 让 自己 变 长 了 。 但 是 如 果 游 戏 中 只 有 一 个 草莓 会 有 些 无 聊 ， 
所 以 若 蛇 吃 了 一 个 草莓 ， 用 下 面 的 代码 增加 一 个 新 的 草莓 到 游戏 界面 中 : 


if raspberrySpawned==0: 


x=random.randrange (1, 32) 
y=random.randrange (1,24) 
raspberryPosition=[int (x*20), int (y*20)] 


raspberrySpawned=1 


这 部 分 代码 通过 判断 变量 raspberrySpawned 是 否 为 0 来 判断 草莓 是 否 被 吃 掉 了 ， 如 果 
被 吃 掉 ， 使 用 程序 开始 引入 的 random 模块 获取 一 个 随机 的 位 置 。 然 后 将 这 个 位 置 和 蛇 的 
每 个 小 节 的 长 度 (20 像素 宽 ，20 像素 高 ) 相 乘 来 确定 它 在 游戏 界面 中 的 位 置 。 随 机 地 放置 
草莓 是 很 重要 的 ， 防 止 用 户 预先 知道 下 一 个 草莓 出 现 的 位 置 。 最 后 将 raspberrySpawned 变 
量 置 1， 以 保证 每 个 时 刻 界 面 上 只 有 一 个 草莓 。 
现在 有 了 让 蛇 移 动 和 生长 的 代码 ， 包 括 草莓 被 吃 和 新 建 的 操作 〈 在 游戏 中 称 为 草莓 重 
生 )， 但 是 还 没有 在 界面 上 画 东西 ， 输 入 下 面 的 代码 : 
playSurface.fill (blackColour) 
for position in snakeSegments: # 画 蛇 (一 系列 方块 》 
pygame.draw.rect (playSurface, whiteColour, Rect (position[0], 
position[1], 20, 20)) 
pygame .draw.rect (playSurface, redColour, Rect (raspberryPosition[0], 
raspberryPosition[1], 20, 20)) # 草 莓 
pygame .display.flip() 


这 些 代 码 让 Pygame 填充 背景 色 为 黑色 ， 蛇 的 头 部 和 身体 为 白色 ， 草 莓 为 红色 。 最 后 
一 行 的 pygame.display.flipO0 让 Pygame 更 新 界面 (如 果 没 有 这 条 语句 ， 用 户 将 看 不 到 任何 
东西 。 每 次 在 界面 上 夯 完 对 象 时 ， 记 得 使 用 pygame.display.flip0 让 用 户 看 到 更 新 )。 
岗 在 还 没有 涉及 蛇 死亡 的 代码 。 如果 游 戏 中 的 角色 永远 死 不 了 , 玩家 很 快 会 感到 无 聊 ， 
所 以 用 下 面 的 代码 设置 一 些 让 蛇 死 亡 的 场景 : 


if snakePosition[0]>620 or snakePosition[0]<0: 


gameOver () 
if snakePosition[1]>460 or snakePosition[1]<0: 
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gameOver () 
第 1 个 让 语句 检查 蛇 是 否 已 经 走出 了 界面 的 上 、 下 边界 , 第 2 个 站 语句 检查 蛇 是 否 已 
经 走出 了 左 、 右 边界 。 这 两 种 情况 都 是 蛇 的 末日 ， 触 发 前 面 定义 的 gameOverO 函 数 ， 打 印 
游戏 结束 信息 并 退出 游戏 。 如 果 蛇 头 撞 到 了 自己 身体 的 任何 部 分 ， 也 会 让 蛇 死亡 ， 所 以 输 
入 下 面 几 行 代码 : 


for snakeBody in snakeSegments[1:]: 


if snakePosition[0]==snakeBody[0] and 
snakePosition[1]==snakeBody[1]: 
gameOver () 


这 里 的 for 语句 遍历 蛇 的 每 一 小 节 的 位 置 ( 从 列表 的 第 2 项 开始 到 最 后 一 项 )， 同 时 和 
当前 蛇 头 的 位 置 比较 。 这 里 用 snakeSegments[1:] 来 保证 从 列表 的 第 2 项 开始 遍历 。 列 表 的 
第 1 项 为 头 部 位 置 ， 如 果 从 第 1 项 开始 比较 ， 那 么 游戏 一 开始 蛇 就 死亡 了 。 

最 后 ， 只 需要 设置 fpsClock 变量 的 值 即 可 控制 游戏 速度 。 


fpsClock.tick(20) 


使 用 IDLE 的 Run Module 选项 或 者 在 终端 中 输入 python snake.py 来 运行 程序 。 
贪 吃 蛇 snake.py 的 完整 源 代码 如 下 : 


import pygame, sys, time, random 
from pygame.locals import * 


pygame .init () 
fpsClock=pygame .time.Clock() 
playSurface=pygame.display.set mode((640, 480)) 
pygame .display.set caption('Raspberry Snake') 
# 定 义 一 些 颜 色 
redColour=pygame.Color (255, 0, 0) 
blackColour=pygame .Color (0, 0, 0) 
whiteColour=pygame.Color (255, 255, 255) 
greyColour=pygame.Color (150, 150, 150) 
# 初 始 化 程序 中 用 到 的 一 些 变量 
snakePosition=[100,100] 
snakeSegments=[[100,100], [80,100], [60,100]] 
raspberryPosition=[300,300] # 草 莓 位 置 
FaspberrySpawned=1 # 是 否 吃 到 草莓 ，1 为 没有 吃 到 ，0 为 吃 到 
direction='right'" # 运 动 方向 
changeDirection=direction 
def gameOver () : 
gameOverFont=pygame.font.Font ('simfang.ttf', 72) 
gameOverSurf=gameOverFont.render('Game Over', True, greyColour) 
gameOverRect=gameOverSurf.get rect() 
gameOverRect .midtop=(320, 10) 
playSurface.blit (gameOverSurf, gameOverRect) 
pygame.display.flip!() 
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time.sleep(5) 


pygame .quit () 


sys.exit() 


while True: 
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for event in pygame.event.get(): 
if event.type==QUIT: 
pygame -quit () 
Sys .exit () 
elif event .type==KEYDOWN: 
if event.key==K RIGHT or event.key==ord('d'): 
changeDirection="'right' 
if event.key==K LEFT or event.key==ord('a') : 
changeDirection='left'" 
if event .key==K UP or event .key==ord('w') : 
changeDirection='up'" 
if event .key==K DOWN or event.key==ord('s'): 
changeDirection="'down' 
if event.key==K ESCAPE: 
pygame .event .post (pygame .event .Event (QUIT) ) 
if changeDirection=='right' and not direction=='left': 
direction=changeDirection 
if changeDirection=='left' and not direction=='right': 
direction=changeDirection 
if changeDirection=='up' and not direction=='down' : 
direction=changeDirection 
if changeDirection=='down' and not direction=='up': 
direction=changeDirection 
if direction=='right' : 
snakePosition[0]+=20 
if direction=='left': 
snakePosition[0]-=20 
if direction=='up': 


snakePosition[1]-=20 


if direction=="'down': 


snakePosition[1]+=20 
# 将 蛇 的 身体 增加 一 节 ， 同 时 将 这 一 节 放 在 蛇 的 头 部 
snakeSegments.insert (0,1ist (snakePosition)) 
# 检 查 蛇 头 部 的 x 和 y 坐标 是 否 等 于 草莓 〈 玩 家 的 目标 点 ) 的 坐标 
if snakePosition[0]==raspberryPosition[0] and snakePosition[1]== 
FaspberryPosition[1]: 

raspberrySpawned=0 


else: 
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snakeSegments .pop () 
# 在 游戏 界面 中 增加 一 个 新 的 草莓 
if raspberrySpawned==0: 
x=random.randrange (1, 32) 
y=random.randrange (1, 24) 
raspberryPosition = [int (x*20),int (y*20)] 
raspberrySpawned=1 
playSurface.fill (blackColour) 
for position in snakeSegments: # 画 蛇 (一 系列 方块 
pygame .draw.rect (playSurface, whiteColour, Rect (position[0], 
position[1], 20, 20)) 
# 画 草莓 
pygame.draw.rect (playSurface, redColour, Rect (raspberryPosition[0], 
raspberryPosition[1], 20, 20)) 
pygame.display.flip() 
if snakePosition[0]>620 or snakePosition[0] < 0: 
gameOver () 
if snakePosition[1]>460 or snakePosition[1] < 0: 
gameOver () 
for snakeBody in snakeSegments[1:]: 
if snakePosition[0]==snakeBody[0] and snakePosition[1]== 
snakeBody[1]: 
gameOver () 
fpsClock.tick(10) 


74 若干 Pygame 设 二 二 


相信 玩 过 《雷电 》 的 朋友 都 熟悉 打 飞 机 ， 这 里 将 游戏 做 了 简化 。 飞 机 的 速度 固定 ， 子 
弹 的 速度 固定 ， 基 本 操作 是 通过 键盘 移动 玩家 飞机 ， 敌 机 随机 从 屏幕 上 方 出 现 并 匀速 落 到 
下 方 ， 子 弹 从 玩家 飞机 发 出 ， 碰 到 目标 飞机 会 击毁 ， 如 果 目 标 飞机 碰 到 玩家 飞机 ， 则 游戏 
结束 并 显示 分 数 。 飞 机 大 战 游戏 的 运行 效果 如 图 17-8 所 示 。 


17.4.1 游戏 角色 


本 游戏 中 所 需 的 角色 包括 玩家 飞机 、 政 机 及 子弹 。 用 户 可 以 通过 键盘 移动 玩家 飞机 在 
屏幕 上 的 位 置 来 打 不 同位 置 的 敌 机 , 因此 设计 玩家 类 Player、 敌 机 类 Enemy 和 子弹 类 Bullet 
对 应 3 种 游戏 角色 。 

对 于 玩家 类 Player， 需 要 的 操作 有 射击 和 移动 两 种 ， 移 动 又 分 为 上 、 下 、 左 、 右 4 种 
情况 。 
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图 17-8 飞机 大 战 游 戏 的 运行 效果 


对 于 敌 机 类 Enemy, 则 比较 简单 , 只 需要 移动 即 可 , 从 屏幕 上 方 出 现 并 移动 到 屏幕 下 方 。 
对 于 子弹 类 Bullet， 与 飞机 相同 ， 仅 需要 以 一 定 的 速度 移动 即 可 。 
玩家 、 子 弹 和 敌 机 都 可 以 写成 一 个 类 ， 继 承 Pygame 的 Sprite 类 ， 实 现 一 些 动画 效果 
以 及 检测 碰撞 。 


import pygame 


from sys import exit 
from pygame.locals import * 
#from gameRole import * 


import random 


SCREEN WIDTH=480 
SCREEN HEIGHT=800 
TYPE SMALL=1 
TYPE MIDDLE=2 
TYPE BIG=3 


# 子 弹 类 
class Bullet (pygame.sprite.sprite): # 继 承 Sprite 精灵 类 
def init (self, bullet img, init pos): 
pygame.sprite.sprite. init _(self) 
self.image=bullet img 
self.rect=self.image.get rect() 


self.rect.midbottom=init pos 
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self.speed=10 
def move (self): 
Self.rect.top==self.speed 
# 玩 家 类 
class Player (pygame.sprite.Ssprite): # 继 承 Sprite 精灵 类 
def _ init (self, plane img, player rect, init pos): 
pygame.sprite.sprite. init _(self) 
self.image=[] # 用 来 存储 玩家 对 象 精灵 图 片 的 列表 
for i in range(len(player rect) ) : 
self.image.append (plane img.subsurface (player rect[i]) 


.convert alpha()) 


self.rect=player rect[0] # 初 始 化 图 片 所 在 的 卸 形 
self.rect.topleft=init pos # 初 始 化 矩形 的 左上 角 坐 标 
self.speed=8 # 初 始 化 玩家 速度 ， 这 里 是 一 个 确定 的 值 
self.bullets=pygame.sprite.Group() # 玩 家 飞机 所 发 射 的 子弹 的 集合 
self.img index=0 # 玩 家 精灵 图 片 索引 

self.is hit=False # 玩 家 是 否 被 击 中 


def shoot(self, bullet img): 
bullet=Bullet (bullet img, self.rect.midtop) 
self.bullets.add (bullet) 
def moveUp (self): 
if self.rect.top <= 0: 
self.rect.top=0 
else: 
self.rect .top-=self.speed 
def moveDown (self): 
if self.rect.top>=SCREEN HEIGHT-self.rect.height: 
self.rect.top=SCREEN HEIGHT-self.rect.height 
Se 
self.rect.top+=self.speed 
def moveLeft (self): 
if self.rect.left<=0: 
3elf.rect.Left=0 
else: 
self.rect.left-=self.speed 
def moveRight (self): 
if self.rect.left>=SCREEN WIDTH-self.rect.width: 
self.rect.]left=SCREEN WIDTH-self.rect.width 
Slses 
self.rect.left+=self.speed 
# 政 机 类 
class Enemy (pygame.sprite.Ssprite): # 继 承 Sprite 精灵 类 


335 | 


| 光 且 项 目 案例 开 


从 入 门 到 实战 一 一 看 虫 、 游 戏 和 机 器 学 习 


def init (self, enemy img, enemy _ down imgs, init pos): 
pygame.sprite.sprite. init (self) 
self.image=enemy img 
self.rect=self.image.get rect() 
self.rect;topleft=init pos 
self.down imgs=enemy down imgs 
self.speed=2 
self.down index=0 
def move (self) : 
self.rect.top+=self .speed 


以 上 设计 了 游戏 中 的 3 个 角色 。 


17.4.2 ”游戏 界面 显示 


在 游戏 画面 中 使 用 了 一 些 飞 机 、 子 弹 图 像 ， 这 里 使 用 shoot.png 文件 (如 图 17-9 所 示 ) 
存储 所 有 飞机 、 子 弹 、 爆 炸 等 图 像 ， 在 程序 中 需要 分 割 出 来 显示 。 当 然 ， 可 以 用 图 像 处 理 


软件 分 解 成 一 个 个 独立 文件 ， 这 样 处 理 后 开发 程序 简单 些 。 


向 二 厅 二 ， 


图 17-9 飞机 大 战 游戏 的 图 像 文件 shootpng 


所 有 的 飞机 都 在 shoot.png 图 片 中 .在 游戏 中 显示 的 元 素 ( 包 括 飞机 、 子 弹 等 ) 在 Pygame 


中 都 是 一 个 surface， 这 时 可 以 利用 Pygame 提供 的 subsurface() 方 法 ， 首 先 载 入 一 张大 
然后 调用 subsurface() 方 法 选取 其 中 的 一 小 部 分 生成 一 个 新 的 surface。 

# 载 入 飞机 图 片 

plane img=pygame.image.load('resources/image/shoot.png') 


# 选 择 飞 机 在 大 图 中 的 位 置 ， 并 生成 subsurface， 然 后 初始 化 飞机 开始 的 位 置 
player rect=pygame.Rect (0, 99, 102, 126) 


playerl=plane img.subsurface (player rect) # 获 取 飞 机 图 片 
player pos=[200, 600] 
screen.blit (playerl, player pos) 韶 绘 制 飞机 
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初始 化 游戏 并 根据 设置 好 的 大 小 生成 游戏 窗口 ; 载 入 游戏 音乐 、 背 景 图 片 background 
.png、 游 戏 结束 画面 gameoverpng 以 及 飞机 和 子弹 图 像 shootpng; 设置 相关 参数 。 最 后 定义 
存储 敌人 的 飞机 精灵 组 enemiesl 和 用 来 泻 染 击毁 精灵 动画 的 爆炸 飞机 精灵 组 enemies_down。 


# 初 始 化 游戏 


pygame .init () 
screen=pygame.display.set mode( (SCREEN WIDTH, SCREEN HEIGHT)) 
pygame .display.set caption(' 飞 机 大 战 ' ) 


# 载 入 游戏 音乐 

bullet sound=pygame.mixer.Sound('resources/sound/bullet .wav') 

enemyl down sound=pygame.mixer.Sound('resources/sound/enemyl down.wav') 
game over sound=pygame.mixer.Sound('resources/sound/game over.wav') 
bullet sound.set volume (0.3) 

enemyl down sound.set Volume (0.3) 

game over sound.set volume(0.3) 

pygame .mixer.music.load('resources/sound/game music.wav') 

pygame .mixer.music.play(-1, 0.0) 

pygame .mixer.music.set volume (0.25) 


background=pygame .image.1load('resources/image/background.png') 
.convert () # 载 入 背景 图 
game over=pygame.image.1load('resources/image/gameover.png') 


# 载 入 游戏 结束 图 gameover .png 


filename='resources/image/shoot .png' 


plane img=pygame.image.1oad (filename) # 载 入 飞机 和 子弹 图 shoot .png 

# 设 置 玩 家 相关 参数 

player rect=[] 

player rect.append (pygame.Rect (0, 99, 102, 126)) # 玩 家 精灵 图 片区 域 
player rect.append (pygame.Rect (165, 360, 102, 126)) 

player rect.append (pygame.Rect (165, 234, 102, 126)) # 玩 家 爆炸 精灵 图 片区 域 


player rect.append (pygame.Rect (330, 624, 102, 126)) 
player rect.append (pygame.Rect (330, 498, 102, 126)) 
player rect.append (pygame.Rect (432, 624, 102, 126)) 
player pos=[200, 600] 

player=Player (plane img, player rect, player pos) 


# 定 义 子弹 对 象 使 用 的 surface 相关 参数 
bullet rect=pygame.Rect (1004, 987, 9, 21) 
bullet img=plane img.subsurface (bullet rect) 


# 定 义 敌 机 对 象 使 用 的 surface 相关 参数 
enemy1 rect=pygame.Rect (534, 612, 57, 43) 


enemyl img=plane img.subsurface (enemyl rect) 


337 | 


| 汪 有 项 目 案例 开发 
从 入 门 到 实战 一 一 仆 虫 、 游 戏 和 机 器 学 习 


enemyl down imgs=[] 


enemyl down imgs.append (plane img.subsurface (pygame.Rect (267, 347, 57, 


43))) 

enemyl down imgs.append (plane img.subsurface (pygame.Rect (873, 697, 57, 
43))) 

enemyl down imgs .append (plane img.subsurface (pygame.Rect (267, 296, 57, 
43))) 

enemyl down imgs.append (plane img.subsurface (pygame.Rect (930, 697, 57, 
43))) 

enemiesl=pygame.sprite.Group() # 存 储 敌 人 的 飞机 

enemies down=pygame.sprite.Group() # 存 储 被 击毁 的 飞机 ， 用 来 泻 染 击毁 精灵 动画 


shoot frequency=0 

enemy frequency=0 

player down index=16 
score=0 

clock=pygame .time.Clock () 
running=True 


17.4.3 ”游戏 的 逻辑 实现 


下 面 进入 游戏 主 循环 ， 在 主 循环 中 进行 了 以 下 操作 : 
@ 处 理 键盘 输入 的 事件 ， 增 加 游戏 操作 交互 


处 理 键盘 输入 的 事件 指 上 、 下 、 左 、 右 按键 操作 ， 增 加 游戏 操作 交互 指 玩家 飞机 的 上 、 


pd 


左 、 右 移动 。 
key pressed=pygame.key.get pressed() 
# 若 玩家 被 击 中 ， 则 无 效 
if not player.is hit: 
下 key_pressed[K w] or key pressed[K UP]: 
Player.moveUp () 
if key pressed[K s] or key pressed[K DOWN 
player.moveDown () 
if key pressed[K a] or key pressed[K LEFT 
player.moveLeft () 
if key pressed[K d] or key pressed[K RIGHT 
player.moveRight () 


@ 处 理子 弹 
这 里 控制 发 射 子弹 的 频率 并 发 射 子弹 ,移动 已 发 射 过 
# 控 制 发 射 子弹 的 频率 并 发 射 子弹 


# 处 理 键盘 事件 移动 飞机 的 位 置 》 


:# 处 理 键盘 事件 (移动 飞机 的 位 置 ) 


:## 处 理 键盘 事件 〈 移 动 飞机 的 位 置 ? 


: # 处 理 键盘 事件 〈 移 动 飞 机 的 位 置 ) 


的 子弹 , 若 超 出 窗口 范围 则 删除 。 


if not player.is hit:  # (1) 判断 玩家 飞机 没有 被 击 中 


if shoot frequency®15==0: 
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bullet sound.play() 
player.shoot (bullet img) 
shoot frequency+=1 
if shoot frequency>=15: 
shoot frequency=0 
# 移 动 已 发 射 过 的 子弹 ， 若 超出 窗口 范围 则 删除 
for bullet in player.bullets: 


bullet .move() # (2) 以 固定 速度 移动 子弹 
if bullet.rect.bottom<0: # (3) 子 弹 移动 出 屏幕 后 删除 子弹 
player.bullets.remove (bullet) # 删 除 子弹 
@ 政 机 处 理 


敌 机 需要 在 界面 上 方 随机 产生 ， 并 以 一 定 的 速度 向 下 移动 ， 详 细 步 又 如 下 : 
(1) 生成 敌 机 ， 需 要 控制 生成 频率 。 

(2) 移动 敌 机 。 

(3) 敌 机 与 玩家 飞机 碰撞 效果 的 处 理 。 

(4) 移出 屏幕 后 删除 敌 机 。 

(5) 敌 机 被 子弹 击 中 效果 的 处 理 
@ 得 分 显示 

在 游戏 界面 的 固定 位 置 显示 消灭 了 多 少 目标 敌 机 。 


score font=pygame.font.Font (None, 36) 


Score text=score font.render(str(score), True, (128, 128, 128))text rect 
=score text.get rect() 
text rect.topleft=[10, 10] 
screen.blit (score text, text rect) 
游戏 主 循环 的 完整 代码 如 下 : 
while running: 
clock.tick (60) # 控 制 游 戏 最 大 帧 率 为 60 
# 控 制 发 射 子弹 的 频率 并 发 射 子弹 
if not player.is hit: 
if shoot frequency % 15==0: 
bullet sound.play() 
player.shoot (bullet img) 
shoot frequency+=1 
if shoot frequency>=15: 
shoot frequency=0 
# 移 动 子 弹 ， 若 超出 窗口 范围 则 删除 
for bullet in player.bullets: 
bullet .move() 
if bullet.rect.bottom<0: 
player.bullets.remove (bullet) 


# 生 成 敌 机 
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hon 项 目 案例 开发 
从 入 门 到 实战 一 一 爬虫 、 游 戏 和 机 器 学 习 


if enemy frequency % 50==0: #(1) 生成 敌 机 ， 需 要 控制 生成 频率 
enemyl pos=[random.randint (0, SCREEN WIDTH - enemyl rect.width), 0] 
enemyl=Enemy (enemyl img, enemyl down imgs, enemyl pos) 
enemies]l .add (enemy1) 

enemy frequency+=1 

if enemy frequency>=100: 
enemy frequency=0 


# 移 动 敌 机 ， 若 超出 窗口 范围 则 删除 


for enemy in enemiesl: 


enemy.move () # (2) 移动 敌 机 
判断 玩家 是 否 被 击 中 
if pygame.sprite.collide circle(enemy, player): 
#(3) 敌 机 与 玩家 飞机 碰撞 效果 的 处 理 


enemies down.add (enemy) 
enemies]l .remove (enemy) 
player.is hit=True 
game over sound.play() 
break 
if enemy.rect.top > SCREEN HEIGHT: 站 (4) 移出 屏幕 后 删除 飞机 
enemjies1l1.remove (enemy) 
# (5) 政 机 被 子弹 击 中 效果 的 处 理 
# 将 被 击 中 的 敌 机 对 象 添加 到 击毁 敌 机 Group 中 ， 用 来 泻 染 击毁 动画 
enemiesl down=pygame.sprite.groupcollide (enemiesl, player.bullets, 1, 1) 
for enemy down in enemiesl down: 
enemies down -add (enemy_down) 


# 绘 制 背景 
screen.fill (0) 
screen.blit (background, (0, 0)) 


# 绘 制 玩家 飞机 
if not player.is hit: 
screen.blit (player.image [player.img index], player.rect) 


# 更 换 图 片 索 引 使 飞机 有 动画 效果 


player.img index=shoot frequency // 8 
A 
player.img index=player down index [AR 


screen.blit (player.image [player.img index], player.rect) 
player down index+=1 
if player down index>47: 

running=False 


# 绘 制 击毁 动画 


for enemy down in enemies down: 
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if enemy down.down index==0: 
enemyl down sound.play() 
if enemy down.down index>7: 
enemies down.remove (enemy down) 
Score+=1000 
continue 
screen.blit (enemy down.down imgs [enemy down.down index // 2], 
enemy down.rect) 
enemy down.down index+=1 
# 绘 制 子 弹 和 敌 机 
player.bullets.draw (screen) 
enemies]l .draw (screen) 
# 绘 制 得 分 
Score font=pygame.font.Font (None, 36) 
score text=score font.render(str(score), True, (128, 128, 128)) 
text rect=score text.get rect() 
text rect.topleft=[10, 10] 
screen.blit (score text, text rect) 
# 更 新 屏幕 
pygame.display.update() 
for event in pygame.event.get(): 
if event .type==pygame .QUIT : 
pygame .quit() 
exit() 
# 监 听 键 盘 事 件 
key pressed=pygame .key.get pressed() 
# 若 玩家 被 击 中 ， 则 无 效 
if not player.is hit: 
省 渗 key_pressed[K_ w] or key pressed[K UP]: 
player.moveUp () 
if key pressed[K s] or key pressed[K DOWN]: 
player.moveDown () 
if key pressed[K a] or key pressed[K LEFT]: 
player.moveLeft () 
if key pressed[K d] or key pressed[K RIGHT]: 
player.moveRight () 


font=pygame.font.Font (None, 48) 


text=font.render('Score: '+ str(score), True, (255, 0, 0)) 


text rect=text.get rect'{) 


text rect.centerx=screen.get rect() .centerx 


text rect.centery=screen.get rect() .centery+24 


screen.blit (game over, (0, 0) 


screen.blit (text, text rect) 
while 1: 


for event in pygame.event.get(): 
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| 项 目 案例 开发 
从 入 门 到 实战 一 一 疏 虫 、 游 戏 和 机 器 学 习 
if event .type==pygame.QUIT: 
pygame.quit () 
exit() 


pygame .display.update () 
目前 基本 实现 了 玩家 移动 并 发 射 子弹 、 随 机 生成 敌 机 、 击 中 敌 机 并 爆炸 、 玩 家 飞机 被 
击毁 、 背 景 音乐 及 音效 、 游 戏 结束 并 显示 分 数 这 几 项 功能 ， 已 经 是 一 个 简单 、 可 玩 的 游戏 。 
整个 游戏 的 实现 不 到 300 行 代码 ， 可 以 看 出 Python 代码 是 多 么 简洁 和 高 效 。 
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18.1 文本 分 类 功能 介绍 


对 于 分 类 问题 ， 其 实 大 家 都 很 熟悉 ， 说 每 个 人 每 天 都 在 执行 分 类 操作 
一 点 也 不 夸张 ， 只 是 大 家 没有 意识 到 罢了 。 例 如 ， 当 看 到 一 个 陌生 人 ， 脑 
子 里 会 下 意识 地 判断 是 男 是 女 ; 走 在 路 上 , 可 能 经 常会 对 身 旁 的 朋友 说 “这 
个 人 一 看 就 很 有 钱 ”“ 这 个 人 看 着 很 谦和 ”之 类 的 话 ， 其实 这 就 是 一 种 分 类 操作 ， 也 就 是 根 
据 这 个 人 身上 的 某 些 特征 做 出 的 一 个 推断 。 

文本 分 类 和 其 他 分 类 本 质 上 是 一 样 的 ， 只 不 过 分 类 的 对 象 是 文本 。 文 本 分 类 问题 是 根据 
文本 的 特征 将 其 分 到 预先 设 定好 的 类 别 中 ,类 别 可 以 是 两 类 ， 也 可 以 是 更 多 的 类 别 。 文 本 数据 
是 互联 网 时 代 的 一 种 最 常见 的 数据 形式 ， 新 闻 报道 、 电 子 邮件 、 网 页 、 评 论 留言 、 博 客 文章 、 
学 术 论文 等 都 是 常见 的 文本 数据 类 型 , 文本 分 类 问题 所 采用 的 类 别 划 分 往往 也 会 根据 目的 不 同 
而 有 较 大 差别 。 例 如 ， 根 据 文本 内 容 可 以 有 “政治 ”“ 经 济 ”“ 体 育 ”等 不 同类 别 ， 根 据 应 用 目 
的 要 求 ， 在 检测 垃圾 邮件 时 可 以 有 “垃圾 邮件 ”和 “ 非 垃圾 邮件 ”根据 文本 特点 ， 在 做 情感 
分 析 时 可 以 有 “积极 情感 文本 ”和 “消极 情感 文本 ”。 可 见 ， 文 本 分 类 的 应 用 非常 广泛 。 

常用 的 文本 分 类 算法 有 朴素 贝 叶 斯 算法 、 支 持 向 量 机 算法 、 决 策 树 、KNN 最 近邻 算法 
等 。KNN 最 近邻 算法 的 原理 最 简单 ， 但 是 分 类 精度 一 般 ， 速 度 很 慢 ; 朴素 贝 叶 斯 算法 对 于 
短文 本 分 类 效果 最 好 ， 精 度 很 高 ， 支 持 向 量 机 算法 的 优势 是 支持 线性 不 可 分 的 情况 ， 在 精 
度 上 取 中 。 本 章 以 朴素 贝 叶 斯 算法 为 例 讲解 文本 分 类 的 一 般 过 程 ， 并 以 垃圾 邮件 过 滤 作为 
朴素 贝 叶 斯 算法 的 一 个 应 用 案例 进行 测试 。 


18.2 程序 设计 的 思路 


文本 分 类 主要 有 3 个 步骤: 


| 项 目 案例 开发 
从 入 门 到 实战 一 一 怜 虫 、 游 戏 和 机 器 学 习 

@ 文本 的 表达 

这 个 阶段 的 主要 任务 是 将 文档 转变 成 矢量 形式 ， 常 用 且 最 简单 的 就 是 词 集 模型 。 其 基 
本 思想 是 假定 对 于 一 个 文档 忽略 其 词 序 、 语 法 和 句法 等 要 素 ， 将 文档 仅仅 看 作 是 若干 词汇 
的 集合 ， 而 文档 中 每 个 单词 的 出 现 都 是 独立 的 ， 不 依赖 于 其 他 词汇 的 出 现 。 简 单 来 说 ， 就 
是 将 每 篇 文档 都 看 成 一 个 词汇 集合 ， 然 后 看 这 个 集合 里 出 现 了 什么 词汇 ， 将 其 分 类 。 例 如 
有 以 下 两 个 文档 。 

文档 一 : Bob likes to play basketball,Jim likes too. 

文档 二 : Bob also likes to play football games. 

基于 这 两 个 文档 ， 先 构造 一 个 词汇 表 : 

wordList={"Bob", "likes", "to", "play", "basketball", "Jim", "too", "also", 

"football", "games"} 

可 以 看 到 ， 这 个 词汇 表 由 10 个 不 同 的 单词 组 成 ， 利 用 单词 在 词汇 表 中 的 索引 ， 上 面 
两 个 文档 都 可 以 用 一 个 10 维 向 量 表示 , 向 量 中 的 每 个 元 素 表示 词汇 表 中 的 相应 单词 在 文档 
中 是 否 出 现 ， 出 现 为 1， 不 出 现 为 0。 

文档 一 ; [1,1,1,1,1,1,1,0,0,0] 

文档 二 : [1,1,1,1,0,0,0,1,1,1] 

@ 分 类 器 的 选择 与 训练 

这 个 阶段 是 文本 分 类 的 关键 步骤， 使 用 的 分 类 算法 不 同 ， 具 体 步 又 也 不 同 ， 这 里 使 用 
朴素 贝 叶 斯 算法 进行 文本 分 类 ， 有 具体 将 在 18.3 节 详 细 介 绍 。 

@ 分 类 结果 的 评价 

机 器 学 习 领 域 的 算法 评估 常用 的 评价 指标 如 下 : 

错 分 率 = 所 有 分 类 错误 的 记录 数 /测试 集中 的 记录 总 数 

准确 率 = 被 识别 为 该 分 类 的 正确 分 类 记录 数 /被 识别 为 该 分 类 的 记录 数 

召回 率 = 被 识别 为 该 分 类 的 正确 分 类 记录 数 /测试 集中 该 分 类 的 记录 总 数 

F1-score=2(; 准 确 率 x 召 回 率 )/(; 准 确 率 + 召回 率 ) 


18.3 ”关键 技术 
18.3.1 ” 贝 叶 斯 算法 的 理论 基础 


@ 条 件 概率 

假设 一 个 盒子 里 装 了 9 个 小 球 ， 如 图 18-1 所 示 ， 其 中 4 个 黑色 的 、5 个 白色 的 ， 如 果 
从 盒子 里 随机 取 一 个 小 球 ， 那 么 是 黑色 小 球 的 可 能 性 有 多 大 ? 由 于 取 小 球 有 9 种 可 能 ， 翰 
中 4 种 为 黑色 , 所 以 取出 黑色 小 球 的 概率 为 4/9。 那 么 取出 白色 小 球 的 概率 又 会 是 多 少 呢 ? 
很 显然 ， 是 5/9。 如 果 用 P(black) 表 示 取 黑色 小 球 的 概率 ， 其 概率 值 等 于 黑色 小 球 的 数量 除 
以 小 球 总 数 。 
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图 18-1 一 个 装 有 9 个 小 球 的 盒子 


如 果 将 9 个 小 球 分 开放 在 两 个 盒子 中 , 如 图 18-2 所 示 ， 那 么 上 述 概率 应 该 如 何 计算 ? 


A 盒 B 盒 
图 18-2 ”将 9 个 小 球 分 别 放 在 两 个 盒子 中 


将 9 个 小 球 如 图 18-2 所 示 放 在 两 个 盒子 中 ， 要 计算 P(black) 或 者 P(white)， 事 先 得 入 
小 球 所 在 盒子 的 信息 会 不 会 改变 结果 ? 假设 从 A 盒 中 取出 黑色 小 球 的 概率 为 P(black|A 
盒 )， 即 “在 已 知 小 球 取 自 A 盒 的 情况 下 取出 黑色 小 球 的 概率 ”， 容易 得 到 从 A 盒 中 取出 黑 
色 小 球 的 概率 P(black|A 盒 ) 为 /4， 这 就 是 所 谓 的 条 件 概率 。 

条 件 概率 的 定义 :已 知事 件 B 发 生 的 条 件 下 事件 A 发 生 的 概率 称 为 事件 A 关于 事件 了 
的 条 件 概率 ， 记 为 PLAIB)。 对 于 任意 事件 A 和 B， 若 P(B)x0， 则 “在 事件 B 发 生 的 条 件 
下 事件 A 发 生 的 条 件 概率 ” 记 为 P(AIB)， 定义 为 PAB) = 、 

那么 ， 对 于 小 球 这 个 例子 来 说 ， 依 据 条 件 概率 的 定义 ，P(blackIA 盒 )-P(black and A 
盒 )/P(A 盒 )。 

下 面 来 看 上 述 公式 是 否 合理 。P(black and A 盒 ) 表 示 取 出 A 盒 中 黑色 小 球 的 概率 , 用 A 
盒 中 的 黑色 小 球 数量 除 以 小 球 总 数 可 得 ， 即 19; P(A 盒 ) 表 示 从 A 盒 中 取 小 球 的 可 能 
即 用 A 盒 中 的 小 球 数量 除 以 小 球 总 数 ,， 即 4/9。 于 是 有 P(black|A 盒 )-P(black and A 盒 )/P(A 
盒 )=(1/9)/(4/9)=1/4， 结 论 与 前 面 分 析 得 到 的 结果 相同 ， 说 明 公 式 完 全 合理 。 

四 全 概率 公式 

若 事件 组 (Ai.A;,….Am) 满 足以 下 关系 : 

(1) Ai(i=1.2,….D) 两 两 互 斥 ， 且 P(Ai)>0。 

(2) 2 Ai =Q ，Q 为 样本 空间 。 
则 称 事件 组 (A1,A2,…,As) 是 样本 空间 Q 的 一 个 划分 。 

全 概率 公式 : 设 (A1,A2,…,An) 是 样本 空间 Q 的 一 个 划分 ，B 为 任 一 事件 ， 则 有 

P(B) = >,P(Ai)P(BIA,) 


i=1 
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| 这 二 项 目 案例 开发 
从 入 门 到 实战 一 一 仆 虫 、 游 戏 和 机 器 学 习 
@ mi 公式 
设 (A1,A2…,A) 是 样本 空间 Q 的 一 个 划分 ，B 为 任 一 事件 ， 则 有 
PCA | 本 -PCAB) __ PAPBIA,) 
P®) Spa)PBIA) 
j=1 


上 式 中 的 Ai 常 被 视 为 导致 试验 结果 B 发 生 的 “原因 ”，P(Ai) (i=1,2,…,n) 表示 各 种 
原因 发 生 的 可 能 性 大 小 ， 故 称 先 验 概率 ，P(AilB) (i=1,2,…,n)〉 则 反映 当 试 验 产 生 了 结果 B 
之 后 再 对 各 种 原因 概率 的 新 认识 ， 故 称 后 验 概率 。 


18.3.2 ”朴素 贝 叶 斯 分 类 


@ 朴素 贝 叶 斯 分 类 的 原理 

朴素 贝 叶 斯 分 类 基于 条 件 概率 、 贝 叶 斯 公式 和 独立 性 假设 原则 。 

基于 概率 论 的 方法 告诉 我 们 ， 当 只 有 两 种 分 类 时 : 

如 果 Pl1(x,y)>P2(x,y)， 那 么 分 入 类 别 1; 

如 果 P2(x,y)>P1(x,y)， 那 么 分 入 类 别 2。 

这 里 提 到 的 Pl1(x,y)、P2(x,y) 是 一 种 简化 描述 ， 分 别 表 示 P(cilx,y) 和 P(czlx,y)， 这 些 符 
号 表示 的 意义 可 以 这 样 理解 ,给 定 某 个 由 x、y 两 个 特征 表示 的 数据 点 , 那么 该 数据 点 是 类 
别 ci 的 概率 是 多 少 ? 是 类 别 cy 的 概率 又 是 多 少 ? 应 用 贝 叶 斯 定理 可 得 : 

A P(x,y|ci)P(c;) 


p(x.y) 

从 而 可 以 定义 贝 叶 斯 分 类 准则 如 下 : 

。 如 果 p(cilx,y)> p(czlx.y)， 那 么 属于 类 别 ci; 

。 如 果 p(cllx,y)<p(czlx.y)， 那 么 属于 类 别 c>。 

这 样 ， 使 用 贝 叶 斯 公式 可 以 通过 计算 已 知 的 3 个 概率 值 来 得 到 未 知 的 概率 值 。 如 果 仅 
仅 为 了 比较 P(cilx, y) 和 P(czlx, y) 的 大 小 ， 因 为 分 母 相同 ， 只 需要 已 知 分子 上 的 两 个 概率 即 
可 。 这 里 还 有 一 个 假设 ， 就 是 基于 特征 条 件 独立 的 假设 ， 也 就 是 上 面 说 到 的 数据 点 的 两 个 
特征 x 和 y 相互 独立 ， 不 会 相互 影响 ， 因 此 可 以 将 P(Cx.ylc) 展 开 成 独立 事件 概率 相 乘 的 形 
式 ， 则 有 : 


P(x.ylci)=P(xIc)P(ylci) 
当然 ， 对 于 多 个 特征 条 件 的 情况 ， 上 式 仍然 成 立 ， 这 样 计算 概率 就 简单 多 了 。 
四 朴素 贝 叶 斯 分 类 的 定义 
扩展 到 一 般 情况 ， 朴 素 贝 叶 斯 分 类 的 正式 定义 如 下 : 
(1) 设 x={a1, az …, am} 为 一 个 待 分 类 项 , ai 为 x 的 一 个 特征 属性 , 有 类 别 C={yi, yz …， 
yo}。 
(2) 计算 p(yilx)，p(yzlx)，…，p(ynlx)。 
(3) 如 果 p(yxlx)=max {p(yi|x), p(y2|X),…, p(yalX)}， 则 xeyxe 
现在 的 关键 是 如 何 计算 第 (2) 步 中 的 各 个 条 件 概 率 ， 可 以 这 么 做 : 
Q@ 找到 一 个 已 知 分 类 的 待 分 类 项 集合 ， 这 个 集合 称 为 训练 样本 集 。 
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@ 统计 得 到 各 类 别 下 各 个 特征 属性 的 条 件 概率 估计 , 即 PCailyi), P(azlyD)，…，, P(amly1); 
P(aily>), P(azly2), **, P(amly2); **; Plailyn), Plazlys), ***, P(anmlys). 
@ 如 果 各 个 特征 属性 是 条 件 独立 的 ， 则 根据 贝 叶 斯 公式 有 如 下 推导 : 
PCy |x)= P(x | yi)P(y;) 
Pp(%) 
因为 分 母 对 于 所 有 类 别 相同 ， 所 以 只 要 将 分 子 最 大 化 即 可 。 又 因为 各 特征 属性 是 条 件 
独立 的 ， 所 以 有 : 


P(x | yi)P(yi)=P(ai |yi)P(azlyi)4 P(au |yi)P(yi) = PTTPa i1y;) 
j=1 


四 朴素 贝 叶 斯 分 类 的 流程 
根据 上 述 分 析 ， 朴 素 贝 叶 斯 分 类 的 流程 可 以 用 图 18-3 表示 。 


准备 阶段 


确定 特征 属性 ”二 == 


获取 训练 样本 


对 每 个 类 别 计算 
P(y,) 
分 类 器 
训练 阶段 


对 每 个 特征 属性 计算 
所 有 划分 的 条 件 概率 


以 PCxly)P(y,) 最 大 
项 作为 x 所 属 类 别 


对 每 个 类 别 计算 
P(xly )P(y.) 


应 用 阶段 


图 18-3 朴素 贝 叶 斯 分 类 流程 


可 以 看 到 ， 整 个 朴素 贝 叶 斯 分 类 分 为 3 个 阶段 。 

(1) 准备 阶段 : 这 个 阶段 为 朴素 贝 叶 斯 分 类 做 必要 的 准备 ， 主 要 工作 是 根据 具体 应 用 
情况 确定 特征 属性 ， 并 对 每 个 特征 属性 进行 适当 划分 ， 然 后 由 人 工 对 一 部 分 待 分 类 项 进行 
分 类 ， 形 成 训练 样本 集合 。 这 一 阶段 的 输入 是 所 有 待 分 类 数据 ， 输 出 是 特征 属性 和 训练 样 
本 集合 。 这 一 阶段 是 整个 朴素 贝 叶 斯 分 类 中 非常 重要 的 一 个 阶段 ， 也 是 唯一 需要 人 工 完 
的 阶段 ， 其 质量 对 整个 过 程 有 重要 影响 ， 分 类 器 的 质量 在 很 大 程度 上 由 特征 属性 、 特 征 属 
性 划分 及 训练 样本 质量 决定 。 

(2) 分 类 器 训练 阶段 : 这 个 阶段 就 是 生成 分 类 器 ， 主 要 工作 是 计算 每 个 类 别 在 训练 样 
本 中 的 出 现 概率 及 每 个 特征 属性 划分 对 每 个 类 别 的 条 件 概率 估计 ， 并 将 结果 记录 。 其 输入 
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P 项 目 案例 开发 
从 入 门 到 实战 一 一 爬虫 、 游 戏 和 机 器 学 习 
是 特征 属性 和 训练 样本 ， 输 出 是 分 类 器 。 这 一 阶段 是 自动 化 阶段 ， 根 据 前 面 讨 论 的 公式 可 
以 由 程序 自动 计算 完成 。 

(3) 应 用 阶段 : 这 个 阶段 的 任务 是 使 用 分 类 器 对 待 分 类 项 进行 分 类 ， 其 输入 是 分 类 器 
和 待 分 类 项 , 输出 是 待 分 类 项 与 类 别 的 映射 关系 。 这 一 阶段 也 是 自动 化 阶段 ， 由 程序 完成 。 


18.3.3 ”使 用 Python 进行 文本 分 类 


在 文本 分 类 中 ， 要 从 文本 中 获取 特征 ， 需 要 先 拆 分 文本 ， 以 一 封 电子 邮件 为 例 ， 电 子 
邮件 中 的 某 些 元 素 构成 特征 。 我 们 可 以 解析 得 到 文本 中 的 词 ， 并 把 每 个 词 作 为 一 个 特征 ， 
而 每 个 词 是 否 出 现 作为 该 特征 的 值 ， 然 后 将 每 一 个 文本 表示 为 一 个 词 条 向 量 ， 就 是 前 面 提 
到 的 词 集 模型 。 每 一 个 文本 的 词 条 向 量 的 大 小 与 词汇 表 中 词 的 数目 一 致 。 
段 设 特征 之 间 相 互 独立 。 所 谓 独 立 指 的 是 统计 意义 上 的 独立 ， 即 一 个 特征 或 者 单词 出 
现 的 可 能 性 与 它 和 其 他 单词 相 邻 没有 关系 ， 比 如 说 ,“ 今 天 天 气 真 好 !” 中 的 “今天 ”和 “天 
气 ” 出 现 的 概率 与 这 两 个 词 相 邻 没有 任何 关系 。 这 个 假设 正 是 朴素 贝 叶 斯 分 类 器 中 “朴素 ” 
一 词 的 含义 。 朴 素 贝 叶 斯 分 类 器 中 的 另 一 个 假设 是 每 个 特征 同等 重要 。 


18.4 程序 设计 的 步骤 


掌握 了 上 面 的 基本 理论 ， 就 可 以 开启 文本 分 类 之 旅 了 ， 本 节 以 判断 留言 板 的 留言 是 否 
为 侮辱 性 言论 为 例 ， 详 细 讲 解 使 用 朴素 贝 叶 斯 算法 进行 文本 分 类 的 过 程 。 

问题 概述 :构建 一 个 快速 过 滤器 来 屏蔽 在 线 社区 留言 板 上 的 侮辱 性 言论 。 如 果 某 条 留 
言 中 出 现 了 负面 或 者 侮辱 性 的 词汇 ， 就 将 该 留言 标识 为 内 容 不 当 。 对 此 问题 建立 两 个 类 
别 一 一 侮辱 类 和 非 侮辱 类 ， 分 别 用 1 和 0 表示。 

现在 正式 开始 ， 首 先 创建 一 个 名 为 Nbayes.py 的 新 文件 ， 然 后 依次 将 程序 清单 添加 到 
文件 中 。 


18.4.1 ”收集 训练 数据 


为 了 将 主要 精力 集中 在 分 类 算法 本 身 ， 直 接 用 简单 的 英文 语 料 作 为 数 ” 回 守 六 

据 集 。 在 实际 应 用 中 ， 可 以 通过 疏 虫 或 其 他 途径 获取 真实 数据 。 视频 讲解 
def loadDataset () : 

postingList=[['my','dog','has','flea', 'problems', 'help', 'please'], 


[maypen not .take sr "him "to "dog park", stupiddls 
Lm "dalmnation "Ls "0 "cute uuI lover hams 
['stop', 'posting','stupid', 'worthless', 'garbage'], 

Lm ks “alto my teak hou "Eo ,Lop nim 
['quit', 'buying', 'worthless','dog', 'food','stupid']] 
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classVec=[0,1,0,1,0,1] #1 代表 侮辱 性 言论 ，0 代表 正常 言论 
return postingList,classVec 
loadDataSet0 函 数 直 接 用 模拟 的 6 个 已 分 词 的 小 文档 和 对 应 的 6 个 类 别 标签 作为 训练 
数据 。 该 函数 返回 两 个 列表 ， 其 中 postingList 表示 已 分 词 的 文档 列表 ，classVec 表示 文档 
对 应 的 类 别 列表 。 


18.4.2 ”准备 数据 


有 了 数据 集 ， 接 下 来 需要 从 数据 集 生 成 文本 的 结构 化 描述 方法 ， 即 向 量 空间 模型 ， 把 
文本 表示 为 一 个 向 量 ， 把 向 量 的 每 个 特征 表示 为 文本 中 出 现 的 词 ， 这 里 用 前 面 提 到 的 词 集 
模型 ， 首 先 遍 历 训练 集中 的 所 有 文本 ， 生 成 词汇 表 。 


def vocabList (dataSet) : 


vocabset=set([]) 坦 使 用 set 创建 不 重复 的 词汇 集 
for document in dataset: 
VocabSet=vocabSet1set (document) # 创 建 两 个 集合 的 并 集 


return list (vocabset) 


VocabList(dataSet) 函 数 的 参数 dataSet 为 文档 集 的 单词 列表 ， 即 loadDataSet0 函 数 的 
postingList 返回 值 。 该 函数 根据 文档 数据 集 dataSet 创建 一 个 包含 在 所 有 文档 中 不 重复 出 现 
的 单词 列表 ， 为 此 使 用 Python 的 set 数据 类 型 。 首 先 创 建 一 个 空 的 集合 ， 然 后 将 每 个 文档 
的 词 集合 加 入 该 集合 中 ， 操 作 符 “|” 表 示 求 两 个 集合 的 并 集 。 

下 面 根据 词汇 表 生 成 每 篇 文档 的 词 集 模型 表示 ， 即 词 向 量 。 

def setOfWordsVec (vocabList,inputText): 

textVec=[0]*len (vocabList) # 创 建 一 个 所 有 元 素 都 为 0 的 向 量 
# 饥 历 文档 中 的 所 有 单词 ， 若 出 现 了 词汇 表 中 的 单词 ， 则 令 文 档 向 量 中 的 对 应 值 为 1 


for word in inputText: 


if word in vocabList: 
textVec[vocabList.index(word) ]=1 
return textVec 


setOfWordsVec(vocabList,inputText) 函 数 有 两 个 参数 ，vocabList 表示 已 知 的 词汇 表 ， 
inputText 表示 某 一 文档 的 单词 列表 ， 函 数 返 回 值 textVec 为 文档 inputText 的 词 向 量 ， 向 量 
中 的 每 一 元 素 为 0 或 1, 表示 词汇 表 中 的 元 素 在 文档 中 是 否 出 现 , 没有 出 现 为 0, 出 现 为 1。 
向 量 的 长 度 与 词汇 表 的 长 度 相 同 。 该 函数 首先 创建 一 个 和 词汇 表 一 样 长 的 向 量 ， 向 量 元 素 
全 部 为 0， 接 着 遍历 文档 中 的 每 个 单词 ， 判 断 该 单词 是 否 在 词汇 表 中 ， 如 果 是 ， 就 将 文档 
词 向 量 相应 位 置 的 元 素 置 为 1。 


18.4.3 ”分 析 数 据 


现在 可 以 检查 函数 的 执行 情况 ， 首 先 检查 单词 列表 ， 看 有 无 遗漏 或 重复 单词 ， 确 保 数 
据 解析 的 正确 性 。 保 存 Nbayes.py 文件 ， 运 行 该 文件 ， 然 后 在 Python 提示 符 下 输入 : 
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| I 项 目 案例 开发 
从 入 门 到 实战 一 一 爬虫 、 游 戏 和 机 器 学 习 

>>> listoposts,1istClasses=loadDataSet () 

>>> wordList=vocabList (listOposts) 

>>> wordList 

[Ge 

"please”; "mnaybe'y "help", Park "food’, "quit’s "is”, SO "buying', 

"Mover, "dalnation, "taker, "him'y "Posting, "how stupid, “nok 

"flea', "problems", "garbage', ‘cute"', ‘to’"] 

经 检查 没有 遗漏 单词 ， 也 没有 重复 单词 ， 这 样 就 生成 了 共有 32 个 单词 的 词汇 表 。 

下 面 检查 setOfWordsVecO) 函 数 的 执行 效果 ， 生 成 第 1 篇 文档 的 词 向 量 : 

>>> setOfWordsVec (wordList,1istOposts[0]) 

Th on Le ly Oe 0 Oe On OR 0 TD Me od on MD Wr Vr 0 0 

os 

可 以 看 到 文档 向 量 中 索引 为 0 的 元 素 为 1， 对 应 词汇 表 中 的 dog， 可 以 查看 第 1 篇 文 
档 ['my','dog','has','flea','problems','help','please']， 发 现 单词 dog 果然 出 现 了 。 同 理 ， 将 其 他 
元 素 值 为 1 的 都 验证 一 遍 ， 完 全 正确 。 

下 面 检查 单词 dog 在 第 5 篇 文档 中 是 否 出 现 。 

>>> setOfWordsVec (wordList,1istOposts[4]) 

Lo Li Lr Or O07 Ly Li lr O07 Lr OF O07 Or OF OF Or OF OF QF Or Oo OF Ty Ds 

ye 

可 以 看 到 文档 向 量 中 索引 为 0( 对 应 词汇 表 中 的 dog) 的 元 素 为 0, 表示 dog 没有 出 现 ， 
可 以 查看 第 5 篇 文档 [mr','icks','ate','my','steak','how','to','stop','him']， 单 词 dog 果然 没有 出 
现 ， 完 全 正确 。 


18.4.4 ”训练 算法 


现在 已 经 知道 了 一 个 单词 在 一 篇 文档 中 是 否 出 现 ， 也 知道 了 该 文档 所 属 的 类 别 。 接 下 
来 重 写 贝 叶 斯 公式 ， 将 之 前 的 x、y 蔡 换 为 w， 粗 体 的 w 表示 一 个 向 量 ， 即 它 由 多 个 值 组 
成 。 在 这 个 例子 中 ， 数 值 个 数 与 词汇 表 中 的 单词 个 数 相同 。 

ple wj= P(w |c;)P(c;) 
Pp(W) 

通过 前 面 的 分 析 可 以 知道 ， 需 要 计算 每 个 类 别 的 这 个 概率 值 ， 然 后 选取 概率 最 大 值 对 
应 的 类 别 作为 最 终 的 类 别 。 上 式 中 每 个 类 别 概率 的 分 母 相 等 ， 因 此 只 需要 计算 分 子 的 两 个 
概率 P(ci) 和 P(wlci)。 

首先 通过 类 别 1 侮辱 性 留言 或 者 非 侮 辱 性 留言 》 中 的 文档 数 除 以 总 的 文档 数 来 计算 
概率 P(ci)。 接 下 来 计算 P(wlc)， 这 里 假设 所 有 单词 都 互相 独立 ， 将 w 展开 为 一 个 个 独立 的 
特征 (单词 ), 那么 概率 P(wlei) 就 可 以 写 为 P(wo, Wi, W2,…, Walci), 可 以 使 用 P(wolci) P(wilci) 
P(wzlc)...P(walcb) 来 计算 上 述 概率 ， 这 样 计算 过 程 就 简便 多 了 。 

下 面 通过 程序 来 计算 两 种 类 别 下 每 个 单词 的 概率 P(wilco)、P(wilc1) 和 每 个 类 别 的 概率 值 
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P(ci)。 因 为 该 问题 是 二 分 类 问题 ， 类 别 只 有 两 类 ， 因 此 只 要 计算 一 种 类 别 的 概率 如 P(ei)， 
另 一 种 类 别 的 概率 P(co)=1-P(c1)。 
P(c1) 表 示 带 有 侮辱 性 语言 的 文档 的 概率 ， 可 以 用 侮辱 性 文档 数目 除 以 文档 总 数 得 到 。 
P(wilc) 表 示 侮 辱 性 文档 中 单词 wi 的 条 件 概率 ， 可 以 用 侮辱 性 文档 中 单词 wi 出现 的 次 
数 除 以 所 有 侮辱 性 文档 的 单词 总 数 得 到 。 
为 了 简化 程序 的 逻辑 ， 在 计算 过 程 中 用 到 了 Numpy 中 的 一 些 函 数 ， 故 应 确保 导入 
numpy 包 ， 需 要 将 from numpy import * 语 句 加 在 Nbayes.py 文件 的 最 前 面 。 


from numpy import * 
def trainNB (trainDocMatrix,trainCategory) : # 训 练 算法 ， 由 词 向 量 计算 概率 
numTrainDoc=len (trainDocMatrix) 间 文 档 数 
numWord=len (trainDocMatrix[0]) # 单 词 数 
# 侮 辱 性 文件 的 出 现 概率 ， 即 用 traincategory 中 所 有 的 1 的 个 数 除 以 文档 总 数 
pAbusive=sum(trainCategory) /float (numTrainDoc) 
# 构 造 单词 出 现 的 次 数 数组 ， 初 值 为 0， 大 小 为 单词 数 
pONum=zeros (numWord) 
plNum=zeros (numWord) 
# 整 个 数据 集 单词 出 现 的 总 数 
pODenom=0.0 
plDenom=0.0 
# 对 每 个 文档 遍历 
for i in range (numTrainDoc) : 
# 是 否 为 侮辱 性 文档 
if trainCategory[i]==1: 
# 如 果 是 侮辱 性 文档 ， 对 侮辱 性 文档 的 向 量 进行 求 和 
plNum+=trainDocMatrix[i] 
# 对 向 量 中 的 所 有 元 素 求 和 ， 也 就 是 计算 所 有 侮辱 性 文档 中 出 现 的 单词 总 数 
plDenom+=sum(trainDocMatrix[i]) 
elses 
pONum+=trainDocMatrix[i] 
pODenom+=sum (trainDocMatrix[i]) 
# 类 别 1 下 每 个 单词 出 现 的 概率 
plVec=plNum/plDenom 
# 类 别 0 下 每 个 单词 出 现 的 概率 
pOVec=pO0Num/pODenom 
return pOVec,plVec,pAbusive 


trainNBO 函 数 有 两 个 参数 trainDocMatrix 和 trainCategory, 分 别 是 所 有 训练 文档 的 词 向 
量 构成 的 矩阵 和 文档 对 应 的 类 别 标签 数组 , 输出 为 P(wlco) ( 即 p0Vec) 、P(wlc1) ( 即 plVec) 
和 P(ec1)( 即 pAbusive) 。 该 函数 首先 计算 P(c1)， 即 文档 属于 侮辱 性 文档 (类 别 为 1) 的 概 
率 ， 用 侮辱 性 文档 数 除 以 文档 总 数 即 可 得 到 。 

计算 p0Vec 和 plVec ( 即 P(wlco) 和 P(wlc1)) ， 需 要 计算 每 一 个 单词 在 每 个 类 别 下 的 概 
率 ， 这 里 用 了 Numpy 数组 快速 计算 ，p0Vec 和 plVec 都 是 向 量 ， 大 小 与 词汇 表 相 同 ， 向 量 
中 的 元 素 值 表示 在 相应 类 别 下 对 应 的 词汇 表 中 的 单词 出 现 的 概率 。 在 程序 中 pl1Num 首先 用 
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Numpy 的 zeros() 初 始 化 为 长 度 与 词汇 表 等 长 的 全 0 数组 ，plDenom 初始 化 为 0。 在 for 循 
环 中 , 遍历 训练 集 的 所 有 文档 ， 如 果 文 档 是 侮辱 性 文档 ,就 将 该 文档 和 plNum 进行 向 量 相 
加 ， 并且 将 该 文档 的 单词 总 数 累加 到 plDenom; 如 果 是 正常 文档 ,也 做 相应 的 处 理 。 这 样 ， 
循环 结束 , plNum 向 量 中 保存 的 是 侮辱 性 文档 中 每 个 单词 出 现 的 次 数 ; plDenom 保存 的 是 
所 有 侮辱 性 文档 中 出 现 的 单词 总 数 ， 是 一 个 整数 ;最 后 用 每 个 单词 出 现 的 次 数 除 以 该 类 别 
中 的 单词 总 数 (p1Nump1Denom)， 则 可 以 得 到 每 个 单词 在 该 类 别 下 的 概率 ， 即 P(wilc) 


(j=0,1,2,…, n)。 


现在 测试 rainNBO 函 数 的 效果 。 将 trainNBO 函 数 的 代码 加 入 Nbayes.py 文件 中 ， 运 行 


该 文件 ， 并 在 Python 提示 符 下 输入 : 


>>> listOposts,1istclasses=loadDataSset () 
>>> wordList=vocabList(1istoposts) 
>>> wordList 


至 此 生成 一 个 包含 所 有 词 的 词汇 表 wordList， 下 面 构建 trainNBO 函 数 所 需要 的 文档 词 
向 量 和 矩阵。 使 用 词 向 量 生成 函数 setOfWordsVec0) 循 环 生 成 每 篇 文档 的 词 向 量 ， 填 充 到 


trainDocMat 矩阵 中 ， 可 以 得 到 最 终 的 文档 词 向 量 矩 阵 。 


>>> trainDocMat=[] 

>>> for inDoc in listOposts: 
trainDocMat .append (setOfWordsVec (wordList, inDoc) ) 

>>> trainDocMat 

放下 用 和 


0, 0, 0, 1, 1, 0, 0, 0], [1, 0, 0, 0, 0, 0, 0, 0, 0 
OF O07 OF Dr 0F Le Tr QF V7 Lo 1 907 0 Gr O07 Ts LO O07 Ty OF OF 
TO Oo Or ON Oe Om oO 0 0 0 D0 Od 


+ 0,0, ’ 

[0, 1, 0, 0, 1, 0, 0, 0, 0, 0, o, 0, 0, 0, 0, 0, 0, 

0, 1, 0, 0], [0, 1, 1, 

0, 0, 0, 0, 0, 0, 1, 0, 1, 0, 0, 90, 0, 0, 0, 1], [1, 0, 
0 


+ 0, 1, 1, 0, 0,1, 0, 0, 0, .0,0,o0,1,0, 0,o0,o, 


口 、 


下 面 给 出 侮辱 性 文档 的 概率 和 两 个 类 别 的 概率 向 量 。 


>>> pP0V,p1V, PRb=trainNB (trainDocMat, listClasses) 


>>> pAb 

Oss 

>>> pO0V 

array ([0.04166667, 0.04166667, 0.125 :1 0.04166667, 0. 四 
0.04166667, 0.04166667, 0.04166667, 0.04166667, 0.04166667, 
0.04166667, 0. ,0.04166667, 0. I 
0. ,0.04166667, 0.04166667, 0. ,0.04166667, 
0.04166667, 0. ，0.08333333，0. ，0.04166667， 
0 -0 ,0.04166667, 0.04166667, 0. 
0.04166667, 0.04166667]) 

>>> plV 

array ([0.10526316, 0.05263158, 0. Pe ,0.10526316, 
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0 本 0 0 5 
0. ,0.05263158, 0. ,0.05263158, 0.05263158, 
0.05263158, 0. 0 ，0.05263158，0. 

天 ，0.05263158，0.05263158，0.05263158，0. 
0.15789474, 0.05263158, 0. 2 0 ，0.05263158， 
0. ，0.05263158]) 


可 以 看 到 , 侮辱 性 文档 的 概率 pAb 为 0.5， 从 训练 数据 可 知 ,一 共有 6 篇 文档 ， 其 中 3 
篇 是 侮辱 性 文档 ， 因 此 该 值 正确 。 下 面 看 看 单词 在 给 定 类 别 下 的 概率 是 否 正 确 ， 词 汇 表 的 
第 1 个 单词 是 dog， 其 在 类 别 0 中 出 现 1 次 ， 而 类 别 0 的 文档 单词 总 数 为 24 个 ， 对 应 的 条 
件 概 率 为 /24=0.04166667; 在 类 别 1 中 出 现 两 次 ， 类 别 1 的 文档 单词 总 数 为 19 个 ， 对 应 
的 条 件 概率 为 /19=0.10526316， 该 计算 是 正确 的 。 下 面 看 看 两 类 概率 中 的 最 大 值 ， 发 现 是 
plV 中 的 0.15789474， 该 概率 的 索引 为 25， 对 应 词汇 表 中 的 stupid， 意 味 着 该 单词 stupid 
是 最 能 表征 类 别 ( 侮 辱 性 文档 类 ) 的 单词 。 通 过 查看 训练 数据 ， 可 以 发 现 单词 stupid 在 3 
篇 侮辱 性 文档 中 全 部 出 现 了 。 


18.4.5 ”测试 算法 并 改进 


从 上 面 的 测试 结果 可 以 看 到 , 在 p0V 和 plV 中 都 存在 一 些 单词 概率 为 0 的 现象 , 那么 
计算 P(wolci)P(wilci)P(wlei)…P(walci) 的 值 肯 定 为 0, 这 将 导致 用 朴素 贝 叶 斯 分 类 器 对 文档 分 
类 时 下 面 式 子 中 的 分 子 为 0， 无 法 比较 概率 大 小 ， 最 终 无 法 分 类 。 

本 PCw|ci)P(Cc) 
p(wW) 

为 了 避免 这 种 现象 ， 可 以 将 所 有 单词 的 出 现 次 数 由 初始 化 为 0 改 为 1， 并 将 plVec= 
plNum/plDenom 和 p0Vec =pONum/p0Denom 中 的 分 母 初始 化 为 2.0， 确保 分 母 不 为 0。 注 
意 , 这 里 初始 化 为 1 或 2 的 目的 主要 是 为 了 保证 分 子 和 分 母 不 为 0, 大 家 可 以 根据 业务 需 
求 进行 更 改 。 

将 trainNBO 函 数 中 初始 化 的 这 几 条 语句 : 


PONum=zeros (numWord) 


Ee 


plNum=zeros (numWord) 
pODenom=0.0 
plDenom=0.0 


修改 为 : 


PONum=ones (numWord) 
plNum=ones (numWord) 
pODenom=2.0 
plDenom=2.0 


另 一 个 需要 注意 的 问题 是 下 溢出 ， 这 是 由 于 很 多 很 小 的 数 相 乘 造成 的 。 当 计算 乘积 
P(wolci)P(wilci)P(wzlci)…P(walci) 时 ， 由 于 大 部 分 因子 都 非常 小 ， 乘积 将 会 变 得 更 小 ， 所 以 可 
E 会 产生 下 溢出 或 者 得 到 不 正确 的 答案 。 一 种 有 效 的 解决 办 法 是 对 乘积 取 自然 对 数 。 因 为 
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ln(ab)=ln(a)+ln(b), 于 是 通过 求 对 数 可 以 避免 下 溢出 或 者 浮 点 数 合 入 导致 的 错误 ,在 数学 上 ， 
fx) 与 In(f(x)) 的 取 值 结果 虽然 不 同 ， 但 在 相同 区 域内 变化 的 趋势 一 致 ， 并 且 在 相同 值 上 取 
到 极 值 。 因 此 ， 采 用 自然 对 数 进行 处 理 不 会 影响 最 终结 果 ， 所 以 将 trainNBO 函 数 中 retum 
前 的 两 行 代码 修改 为 : 


plVec=10g (plNum/plDenom) 


pOVec=10g (pONum/pODenom) 


到 现在 为 止 ， 分 类 器 已 经 修改 好 了 ， 下 面 开始 检验 分 类 效果 。 
18.4.6 ”使 用 算法 进行 文本 分 类 


依据 补 素 贝 叶 斯 公式 Pes |w) = ee 及 前 面 的 分 析 , 只 要 计算 公式 中 的 分 子 即 


可 ， 重 点 是 比较 分 子 的 大 小 ， 分 子 大 的 对 应 的 类 别 就 是 文档 的 类 别 。 将 trainNB(O 函 数 求 得 
的 3 个 概率 p0Vec、plVec、pAbusive 及 需要 分 类 文档 的 词 向 量 代 入 公式 ， 分 别 比 较 两 种 类 
别 下 的 概率 大 小 ， 即 可 确认 文档 的 类 别 。classifyNBO 函 数 实现 了 上 述 过 程 。 


def classifyNB (textVec,pOVec,plVec,pClassl1): 
分 类 函数 
:param textVec: 要 分 类 的 文档 向 量 
:param p0Vec: 正常 文档 类 (类别 0) 下 的 单词 概率 列表 
:param plVec: 侮辱 性 文档 类 (类别 1) 下 的 单词 概率 列表 
:param pCclassl: 侮辱 性 文档 (类别 1) 概率 
:return: 类 别 1 或 0 
pl=sum (textVec*plVec)+l0og (pClass1) 
pO0=sum (textVec*p0OVec)+10g (1.0-pClass1) 
print ('pl="',p1) 
print ('p0="',p0) 
if pl>p0: 
return 1 
elses 


return 0 


为 了 测试 更 加 方便 ， 将 前 面 在 Python 提示 符 下 的 所 有 操作 进行 封装 ， 构 造 测试 函数 
testNB()。 


def testNB(): # 朴 素 贝 叶 斯 算法 测试 
# (1) 加 载 数据 集 
listOposts,1istClasses=loadDataSset () 
# (2) 创建 词汇 表 


wordList=vocabList (listOposts) 
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# (3) 构造 训练 数据 的 文档 词 向 量 和 矩阵 

trainDocMat=[] 

for inDoc in listOposts: 
trainDocMat .append (setOfWordsVec (wordList, inDoc)) 

# (4) 训练 数据 

POV, pl1V, pAb=trainNB (array (trainDocMat) ,array (listclasses)) 

# (5) 测试 数据 

testText=["'love'; "my'; "ate"] 

thisDoc=array (setOofWordsVec (wordList, testText)) 

print (testText, 'classified as:',classifyNB (thisDoc, pOV,pI1V, pADb)) 

testText=['stupid','dog'] 

thisDoc=array (setofWordsVec (wordList, testText)) 

print (testText, 'classified as:',classifyNB (thisDoc,pOV,p1V, pADb)) 


将 所 有 函数 保存 到 Nbayes.py 文件 中 ， 运 行 该 文件 ， 并 在 Python 提示 符 下 输入 : 
>>> testNB () 
可 以 看 到 运行 结果 如 下 : 


pl=-9.826714493730215 
p0=-7.694848072384611 

['love', 'my', 'ate'] classified as: 0 
pl=-4.2972854062187915 
pO0=-6.516193076042964 

['stupid', 'dog'] classified as: 1 


18.5 ”使 用 朴素 贝 叶 斯 分 类 算法 过 滤 
垃圾 邮件 le 


上 解 
18.4 节 运 用 朴素 贝 叶 斯 算法 完整 实现 了 社区 留言 板 言论 的 分 类 ， 下 面 将 朴素 贝 叶 斯 算 
法 应 用 于 垃圾 邮件 过 滤 ， 同 样 用 朴素 贝 叶 斯 算法 分 类 的 通用 框架 来 解决 该 问题 。 使 用 朴素 
贝 叶 斯 算法 对 电子 邮件 进行 分 类 的 实现 流程 如 下 。 
(1) 收集 训练 数据 : 提供 已 知 的 文本 文件 。 
(2) 准备 数据 : 将 文本 文件 解析 为 词 向 量 。 
(3) 分 析 数 据 : 检查 词 条 确保 解析 的 正确 性 。 
(4) 训练 算法 :从 词 向 量 计算 概率 ， 使 用 前 面 建立 的 trainNBO 函 数 。 
(5) 测试 算法 : 使 用 朴素 贝 叶 斯 算法 进行 交叉 验证 。 
(6) 使 用 算法 : 构建 完整 的 程序 对 一 组 邮件 进行 分 类 ， 将 错 分 的 邮件 输出 到 屏幕 上 。 


18.5.1 收集 训练 数据 


假设 训练 数据 已 知 ， 这 里 用 50 封 邮 件 作 为 训练 数据 ， 其 中 垃圾 邮件 和 非 垃圾 邮件 各 
25 封 。 
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18.5.2 ”将 文本 文件 解析 为 词 向 量 


在 18.4 节 中 ,为 了 着 重 理解 朴素 贝 叶 斯 算法 分 类 的 核心 过 程 ， 文 本 的 词 向 量 是 预先 给 
定 的 ， 下 面 介 绍 如 何 从 文本 构建 自己 的 词 向 量 。 

对 于 一 个 英文 文本 字符 串 ， 可 以 使 用 Python 的 string.split( 方 法 切 分 。 下 面 看 一 下 实 
际 的 运行 效果 。 在 Python 提示 符 下 输入 : 


>>> text='In fact, persistence hunting remained in use until 2014, such 
as with the San people of the Kalahari Desert.' 

>>> text.split() 

['In', 'fact,', 'persistence', 'hunting', 'remained’, "in’', "use’, "until’, 
"20L47" "ouch ass "wih thers Sant, Ppoeoplos “oF the 
'Kalahari', 'Desert.'] 


可 以 看 到 在 默认 情况 下 split0 按 照 单词 之 间 的 空格 进行 切 分 ， 整体 切 分 效果 不 错 ， 但 美 
中 不 足 的 是 ， 标 点 符号 也 被 当 作 单词 的 一 部 分 进行 了 切 分 。 可 以 使 用 正则 表达 式 来 切 分 文 
本 ， 其 中 分 隔 符 是 除 单词 、 数 字 以 外 的 任意 字符 串 。 

>>> import re 

>>> regEx=re.compile('\W*') 


>>> wordList=regEx.split (text) 
>>> wordList 


['In', 'fact', 'persistence', 'hunting', 'remained', 'in', 'use'’', 'until', 

“0A aul Sas Malth har San "PoopLeor, of “ther Kalahari,, 

"Desert, SAY 下 

可 以 看 到 标点 符号 没有 了 ， 但 是 多 了 空 字 符 串 ， 可 以 计算 字符 串 的 长 度 ， 只 返回 长 度 
大 于 0 的 字符 串 ， 去 掉 空 字符 串 。 这 里 用 列表 推导 式 实 现 : 

>>> [word for word in wordList if len(word)>0] 

['In', 'fact', 'persistence', 'hunting', 'remained', 'in', 'use’', 'until', 


TO "gach "as With" "the "San'yp "Peopley “ofr "the Kalalari’, 

'Desert'] 

可 以 看 到 空 字符 串 去 掉 了 ,但 是 英文 句子 的 第 1 个 单词 和 专用 名 词 的 首 字母 是 大 写 的 ， 
为 了 使 所 有 单词 的 形式 统一 ， 将 其 全 部 转换 成 小 写 ， 用 lower() 函 数 即 可 实现 。 


>>> [word.lower() for word in wordList if len(word)>0] 
['in', 'fact', 'persistence', 'hunting', 'remained', 'in', "use', 'until', 


"Old ouch Vas With, EDeN “san, "Beoplory "of "Lhe kalalari. 
'desert'] 


另外 ， 在 实际 处 理 中 通常 也 要 过 滤 掉 长 度 小 于 3 的 字符 串 ， 使 得 词汇 表 尽 量 小 一 些 。 
将 上 面 的 文本 处 理 过 程 整理 为 一 个 独立 的 文本 解析 函数 。 


import Fe 
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def textParse (text): 
regEx=re.compile('\W*"') 
wordList=re.split (regEx, text) 


return [word.lower() for word in wordList if len(word)>2] 


当然 ， 在 实际 应 用 中 文本 解析 是 一 个 相当 复杂 的 过 程 ， 这 里 是 一 种 简单 的 处 理 。 尤 其 
是 中 文 文本 的 解析 ， 由 于 不 像 英文 句子 中 有 空格 分 隔 ， 要 识别 出 中 文 文本 中 的 词汇 ， 即 中 
文 分 词 本 身 就 是 一 个 值得 研究 的 应 用 领域 。 但 好 在 现在 有 一 些 成 熟 的 支持 Python 的 专门 的 
分 词 模块 ， 这 里 推荐 使 用 jieba 分 词 ， 它 专门 使 用 Python 的 分 词 系统 ， 占 用 的 资源 少 ， 常 
识 类 文档 的 分 词 精度 较 高 ， 对 于 非 专业 文档 绰绰有余 ， 如 果 需 要 可 以 直接 下 载 使 用 。 
现在 将 电子 邮件 文本 传 入 textParse(0) 函 数 ， 就 可 以 得 到 该 电子 邮件 的 单词 列表 。 
调用 18.4 节 实 现 的 vocabListO 函 数 可 以 生成 所 有 训练 数据 的 词汇 表 。 构 建文 档 的 词 向 
量 可 以 用 18.4 节 实 现 的 setOfWordsVec0 函 数 。 训 练 算法 则 直接 调用 trainNBO 函 数 ， 这 里 
不 再 重复 叙述 。 直 接 用 分 类 算法 进行 邮件 分 类 测试 。 


18.5.3 ”使 用 朴素 贝 叶 斯 算法 进行 邮件 分 类 


这 里 使 用 朴素 贝 叶 斯 算法 对 邮件 进行 分 类 ， 并 进行 交叉 验证 。 交 叉 验 证 也 称 为 循环 估 
计 ， 是 一 种 统计 学 上 将 数据 样本 切割 成 较 小 子 集 的 实用 方法 。 在 给 定 的 建 模样 本 中 ， 拿 出 
大 部 分 样本 进行 建 模 ， 留 小 部 分 样本 用 刚 建立 的 模型 进行 预报 ， 并 求 这 小 部 分 样本 的 预报 
误差 。 

本 例 中 的 样本 数据 共有 50 封 邮件 ， 随 机 选择 10 封 邮件 作为 测试 集 ， 剩 下 的 40 封 邮 
件 作为 训练 集 。 


def spamTest () : 


对 贝 叶 斯 垃圾 邮件 分 类 器 进行 自动 化 处 理 
return: 对 测试 集中 的 每 封 邮件 进行 分 类 ， 若 邮件 分 类 错误 ， 则 错误 数 加 1， 最 后 返回 错 分 率 
emailWordList=[] # 邮 件 的 词 向 量 列表 ， 大 小 与 邮件 数 相同 
classList=[] # 邮 件 的 类 别 标签 列表 
# 这 里 提供 的 训练 邮件 共 50 封 ， 垃 圾 邮件 和 正常 邮件 分 别 25 封 
for i in range(1,26) : 
# 切 分 ， 解 析 数 据 ， 并 归 类 为 1 类 别 
wordList=textParse (open ('email/spam/%d.txt' $%$ i ,encoding="utf-8") 
.read()) 
emailWordList.append (wordList) 


classList.append(1) 

# 切 分 ， 解 析 数 据 ， 并 归 类 为 0 类 别 

wordList=textParse (open ('email/nospam/%d.txt' gs i ,encoding="utf-8") 
.read()) 

emailWordList.append (wordList) 

classList.append(0) 
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坦 创建 词汇 表 


wordTable=vocabList (emailWordList) 
trainingSset=1ist (range (50)) 
# 构 造 测试 集 
testset=[] 
# 随 机 选择 10 封 邮件 用 来 测试 
for i in range(10): 
randIndex=int (random.uniform(0, len (trainingset))) 
testSet .append (trainingset [randIndex]) 
del (trainingSet[randIndex]) 
# 构 造 训练 集 文档 词 向 量 矩 阵 和 对 应 的 类 别 向 量 
trainDocMat=[] 
trainDocCclass=[] 
for docIndex in trainingSet: 
trainDocMat .append (setOfWordsVec (wordTable, 
emailWordList[docIndex])) 
trainDocClass.append (classList[docIndex]) 


# 用 训练 集 的 邮件 进行 训练 


pOV, plV, pSpam=trainNB (array (trainDocMat) ,array (trainDocClass)) 


errorCount=0 # 记 录 错 误 邮 件 的 数目 
# 用 测试 集中 的 邮件 进行 分 类 测试 
for docIndex in testSet: 


# 对 每 一 封 邮 件 生成 词 向 量 


wordVector=setOfWordsVec (wordTable, emailWordList [docIndex]) 


# 测 试 的 分 类 类 别 与 原 标注 类 别 比较 ， 若 不 相等 ， 说 明 分 类 错误 
if classifyNB (array (wordVector) ,pOV,pl1V,pSpam) != 
classList[docIndex]: 
print ("classification error:",docIndex) 
errorCount+=1 
errRate=float (errorCount/len (testset)) # 错 分 率 
print('the error rate is :', errRate) 


spamTest( 函 数 对 朴素 贝 叶 斯 垃圾 邮件 分 类 器 进行 自动 化 处 理 。 首 先导 入 已 经 整理 好 的 
垃圾 邮件 和 正常 邮件 的 文本 文件 , 分 别 在 文件 夹 spam 与 noSpam 下 ， 并 分 别 对 它们 进行 解 
析 处 理 ， 生 成 邮件 的 词 向 量 列表 emailWordList 和 类 别 列表 classList。 调 
vocabList() 方 法 ， 可 以 得 到 没有 重复 单词 的 词汇 表 wordTable。 


接 下 来 进行 交叉 验证 ， 需 要 分 别 构建 训练 集 和 测试 集 ， 本 例 中 


用 18.4 节 案 例 的 


Ph 共 有 50 封 邮件 ， 随 机 


选择 10 封 作为 测试 集 ， 剩 下 的 40 封 邮 件 作 为 训练 集 。 那 么 如 何 选择 呢 ? 初始 化 时 
trainingSet= list(range(50))、testSet=[], 可 以 知道 trainingSet 是 一 个 0 一 49 的 整数 列表 ,testSet 


是 一 个 空 列 表 。 随 机 函数 random.uniform() 可 以 生成 一 个 指定 范围 
int(random uniform(0.len(trainingSeb)) 将 产生 一 个 0 一 49 的 整数 ， 产 和 4 


表 testSet 中 ， 同 时 将 该 数字 从 训练 集 trainingSet 中 删除 ， 循 环 10 次 ， 就 随机 产生 了 10 个 


内 的 随机 浮 点 数 ， 
E 的 数字 加 入 测试 集 列 


0 一 49 的 整数 ， 整 数 索 引 对 应 的 邮件 作为 测试 集 ， 剩 下 的 40 封 邮件 作为 训练 集 。 


接着 遍历 训练 集中 的 所 有 文档 ， 对 每 封 邮件 基于 词汇 表 并 使 
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造 训练 集 的 词 向 量 矩 阵 trainDocMat， 同 时 生成 类 别 向 量 trainDocClass， 并 通过 训练 函数 
trainNBO 计 算出 分 类 所 需要 的 3 个 概率 。 

最 后 遍历 测试 集 ， 对 每 封 邮 件 用 classifyNBO 进 行 分 类 ， 与 已 知 的 邮件 类 别 进行 对 比 ， 
如 果 分 类 错误 则 错误 数 加 1， 并 输出 错 分 的 邮件 索引 ， 以 便于 进一步 查验 ， 最 后 给 出 总 的 
错 分 率 。 

下 面 对 上 述 过 程 进行 测试 ， 将 上 述 所 有 程序 代码 保存 至 Nbayes.py 文件 中 并 运行 ， 在 
Python 提示 符 下 输入 : 


>>> SpamTest () 
the error rate is : 0.0 
>>> SpamTest () 
classification error: 32 


the error rate is : 0.1 


spamTestO 函 数 会 输出 10 封 随 机 选择 的 邮件 的 分 类 错误 率 ， 上 面 的 测试 是 运行 两 次 的 
结果 ， 因 为 测试 集 的 10 封 邮 件 是 随机 选择 的 , 每 次 选择 的 测试 集 不 一 定 相 同 ， 所 以 每 次 的 
运行 结果 可 能 会 有 些 差 别 。 如 果 有 分 类 错误 ， 会 输出 文档 索引 ， 以 便于 进一步 分 析 错 分 的 
邮件 。 为 了 更 精确 地 估计 错 分 率 ， 需 要 重复 运行 多 次 ， 然 后 求 平均 值 ， 运 行 100 次 ， 获 得 
的 平均 错 分 率 为 3.5%。 


18.5.4 ”改进 算法 


在 前 面 的 算法 中 ， 把 邮件 文本 用 词 集 模型 表示 ， 将 文本 的 每 个 词 作为 一 个 特征 ， 将 词 
是 否 出 现 作为 特征 的 值 。 实 际 上 ， 大 家 经 常见 到 一 个 词 在 一 个 文本 中 多 次 出 现 的 情况 ， 一 
个 词 多 次 出 现 是 否 可 以 比 是 否 出 现 更 加 能 够 表达 某 种 意义 ? 这 种 方法 被 称 为 词 袋 (Bag of 
Words) 模型 。 下 面 来 试 一 试 。 
只 要 将 词 集 模 型 中 的 单词 是 否 出 现 修改 为 出 现 次 数 就 可 以 了 ， 这 样 只 需要 对 
setOfWordsVec() 函 数 做 简单 修改 ， 当 扫描 到 一 个 单词 时 就 将 词 向 量 中 该 单词 的 对 应 值 加 1。 
def bagOofWordsVec (vocabList, inputText) : 
textVec=[0]*len (vocabList) # 创 建 一 个 所 包含 元 素 都 为 0 的 向 量 
# 遍 历 文档 中 的 所 有 单词 ， 若 出 现 了 词汇 表 中 的 单词 ， 则 将 文档 向 量 中 的 对 应 值 加 1 


for word in inputText: 


if word in vocabList: 
textVec[vocabList .index(word) ] +=1 
return textVec 
修改 spamTestO 函 数 ， 将 两 处 生成 词 向 量 的 语句 改 为 调用 上 面 的 词 袋 模型 函数 
bagOfWordsVec()， 重 新 执行 spamTestO 函 数 100 次 ， 得 到 的 错 分 率 为 0， 看 来 这 样 修改 后 
确实 可 以 提高 分 类 的 准确 度 。 当 然 ， 在 实际 分 类 中 是 做 不 到 百分之百 正确 的 ， 这 可 能 和 用 
户 选用 的 数据 集 有 关 。 
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Scikit-Learn 是 一 个 用 于 机 器 学 习 的 Python 库 ， 建 立 在 Numpy、Scipy 和 Matplotlib 基 
出 之 上 。 它 提供 了 机 器 学 习 常 用 的 算法 模块 ， 例 如 监督 学 习 、 无 监督 学 习 、 模 型 选择 和 评 
估 、 数 据 集 转换 等 ， 在 监督 学 习 模块 中 包含 机 器 学 习 常用 的 分 类 算法 ， 例 如 朴素 贝 叶 斯 、 
KNN、 决 策 树 、 支 持 向 量 机 等 。 
Scikit-Lear 的 官方 网 站 “http://scikit-learn.org” 是 学 习 和 应 用 机 器 学 习 算法 的 最 重要 
的 工具 之 一 ， 以 朴素 贝 叶 斯 算法 为 例 ， 网 站 提供 了 一 整套 算法 学 习 的 教程 和 资源 ， 网 址 为 
“http://scikit-learn.org/stable/modules/naive_bayes.html”。 
如 果 要 安装 Scikit-Leam， 需 要 先 安装 Numpy、Scipy 和 Matplotlib， 直 接 用 pip install 
命令 安装 : 


pip install numpy 


pip install scipy 
pip install matplotlib 
pip install scikit-learn 


本 节选 择 Scikit-Learn 的 朴素 贝 叶 斯 算法 进行 文本 分 类 ， 对 18.4 节 和 18.5 节 的 例子 重 
新 进行 实现 。 

用 Scikit-Learn 的 朴素 贝 叶 斯 算法 进行 文本 分 类 包含 以 下 几 个 步骤 : 

(1) 收集 样本 数据 。 

(2) 提取 文本 特征 : 生成 文本 的 向 量 空间 模型 。 

(3) 训练 分 类 器 。 

(4) 在 测试 集 上 进行 测试 。 

(5) 分 类 结果 评估 。 


18.6.1 文本 分 类 常用 的 类 和 函数 


@@ lo0ad_files0 函 数 
该 函数 位 于 sklearn.datasets 模块 下 ， 功 能 是 加 载 文 本 文件 ， 将 二 层 文件 夹 名 字 作 为 分 
类 类 别 。Scikit-Learm 本 身 也 自 带 了 一 些 数据 集 ， 可 以 供用 户 学 习 测试 使 用 ， 一 般 通 过 
sklearn.datasets 模块 下 的 其 他 函数 加 载 使 用 。 


sklearn.datasets.load files (container path, description=None, 


categories=None, load content=True, shuffle=True, encoding=None, 
decode error='strict', random state=0) 

主要 参数 如 下 。 

。 container path: 文件 夹 的 路 径 。 

。 load_content: 是 否 把 文件 中 的 内 容 加 载 到 内 存 ， 该 项 为 可 选项 ， 默 认 值 为 True。 
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。 encoding: 编码 方式 。 当 前 文本 文件 的 编码 方式 一 般 为 “utf-8”， 如 果 不 指明 编码 方 
式 (encoding=None), 那么 文件 内 容 将 会 按照 bytes 处 理 , 而 不 是 按照 unicode 处 理 ， 

其 默认 值 为 None。 

该 函数 的 返回 值 为 Bunch 对 象 ， 主 要 属性 如 下 。 

。 data: 原始 数据 。 

。 filenames: 每 个 文件 的 名 字 。 

。 target: 类 别 标签 (从 0 开始 的 整数 索引 )。 

。 target names: 类 别 标签 的 具体 含义 (由 子 文件 夹 的 名 字 决 定 )。 

注意 : 需要 将 数据 组 织 成 如 下 文件 结构 ， 有 几 种 类 别 就 有 几 个 子 文件 夹 ， 当 然 文 件 
及 文件 的 名 字 可 以 自 定义 。 


container folder/ 


~ 


category 1 folder/ 
于 人 2 
category 2 folder/ 
ren 


例如 在 垃圾 邮件 过 滤 例子 中 ，email 文件 夹 下 的 二 级 文件 夹 spam 和 noSpam 将 作为 类 
别 标签 。 

四 train_test_split0 函 数 

该 函数 位 于 sklearn.model_selection 模块 下 , 能 够 从 样本 数据 随机 按 比例 选取 训练 子 集 
和 测试 子 集 ， 并 返回 划分 好 的 训练 集 测试 集 样本 和 训练 集 测试 集 标 签 。 

sklearn.model selection.train test split(train data,train target, 

test size, random state) 


参数 如 下 。 
train_data: 被 划分 的 样本 特征 集 。 
train_target: 被 划分 的 样本 标签 。 
test_size: 如 果 是 0 一 1 的 浮 点 数 ， 表 示 样 本 占 比 ， 如 果 是 整数 ， 则 是 样本 的 数量 ， 
该 项 为 可 选项 ， 默 认 值 为 None。 
random state: 随机 数 的 种 子 , 不同 的 种 子 会 造成 不 同 的 随机 采样 结果 ,相同 的 种 子 
采样 结果 相同 ， 该 项 为 可 选项 ， 默 认 值 为 None。 

© CountVectorizer 类 

该 类 是 文本 特征 提取 模块 sklearn.feature_extraction.text 下 的 一 个 常用 的 类 ， 能 够 将 文 
档 词 块 化 ， 并 进行 数据 预 处 理 ， 例 如 去 音调 、 转 小 写 、 去 停 用 词 ， 最 后 生成 文档 的 词 频 算 
阵 ， 即 前 面 所 说 的 词 袋 模型 。 


class sklearn.feature extraction.text.CountVectorizer (input=u'content', 


encoding=u'utf-8', decode error=u'strict', strip accents=None, lowercase 
=True, preprocessor=None, tokenizer=None, stop words=None,token pattern 
=u'(?u) \b\W\w+\b', ngram range=(1, 1), analyzer=u'word', max df=1.0,min 
df=1,max features=None, vocabulary=None, binary=False, dtype=<type 'numpy- 
int64'>) 
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| 项 目 案例 开发 
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其 参数 很 多 ， 这 里 介绍 最 常用 的 几 个 ， 其 他 用 默认 值 即 可 。 


stop words: 设置 停 用 词 ， 可 以 为 english、list 或 None (默认 值 )， 设 为 english 将 


使 用 内 置 的 英语 停 用 词 , 设 为 一 个 list 可 自 定 义 停 用 词 , 设 为 None 则 不 使 用 停 用 词 ， 


设 为 None 且 max dfe[0.7. 1.0) 将 自动 根据 当前 的 语料库 如 


e lowercase: 是 否 将 所 有 字符 转变 成 小 写 ， 默 认 值 为 True。 


立 停 


j 词 表 。 


。 token_pattem: 表示 token 的 正则 表达 式 ， 只 有 当 analyzer 一 'word' 时 才 使 用 ， 默 认 
的 正则 表达 式 选择 两 个 及 以 上 的 字母 或 数字 作为 token, 标点 符号 默认 当 作 token 分 


隔 符 ， 而 不 会 被 当 作 token。 


。 analyzer: 一 般 使 用 默认 值 , 可 设置 为 string 类 型 {'word', 'char', 'char_wb'} 或 callable， 


特征 基于 wordn-grams 或 character n-grams。 


。 decode_error: 默认 为 strict， 若 遇 到 不 能 解码 的 字符 将 报 UnicodeDecodeError 错误 ， 


设 为 ignore 将 会 忽略 解码 错误 。 


CountVectorizer 类 的 核心 函数 是 fit_transform()， 通 过 该 函数 能 够 学 习 词 汇 表 ， 返 回 文 


档 的 词 频 矩阵 。 


fit transform(raw documents, y=None) 


其 返回 值 是 文档 的 词 频 和 矩阵 ， 和 矩阵 大 小 为 文档 数 x 特征 数 。 
四 MultinomialNB 类 


其 参数 raw_documents 为 迭代 器 ， 可 以 是 str、unicode 或 文件 对 象 。 


在 Scikit-Leam 中 共有 3 个 朴素 贝 叶 斯 的 分 类 算法 类 ， 分 别 是 GaussianNB 、 
MultinomialNB 和 BermoulliNB 。 其 中 ，GaussianNB 是 先 验 概率 为 高 斯 分 布 的 朴素 贝 叶 斯 ， 
MultinomialNB 是 先 验 概率 为 多 项 式 分 布 的 朴素 贝 叶 斯 ， BemoulliNB 是 先 验 概率 为 伯 努 


利 分 布 的 朴素 贝 叶 斯 。 


bw ed 


3 


这 3 个 类 适用 的 分 类 场景 不 同 ， 一 般 来 说 ， 如 果 样本 特征 的 分 布 大 部 分 是 连续 值 ， 使 
GaussianNB 会 比较 好 ; 如 果 样 本 特征 的 分 布 大 部 分 是 多 元 离散 值 ， 使 用 MultinomialNB 
较 合适 ， 如 果 样 本 特征 是 二 元 离散 值 或 者 很 稀疏 的 多 元 离散 值 ， 应 该 使 用 BermoulliNB。 
因为 考虑 文本 分 类 中 的 特征 是 离散 的 单词 ， 所 以 用 MultinomialNB。 


class sklearn.naive bayes.MultinomialNB (alpha=1.0,fit prior=True,class 


prior=None) 


参数 如 下 。 


。 alpha: 拉 普 拉 斯 平滑 参数 ， 是 一 个 大 于 0 的 常数 ， 该 项 为 可 选项 ， 默 认 值 为 1。 
。 fit_prior: 是 否 要 考虑 先 验 概率 ， 如 果 是 False， 则 所 有 的 样本 类 别 输出 都 有 相同 的 


类 别 先 验 概率 ， 该 项 为 可 选项 ， 默 认 值 为 True。 


。 class_prior: 类 别 的 先 验 概率 ， 该 项 为 可 选项 ， 默 认 值 为 None。 


MultinomialNB 类 下 有 两 个 核心 函数 。 
(1) fit0 函 数 : 拟 合 朴素 贝 叶 斯 分 类 器 。 


fit(X, y, sample weight=None) 
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。X: 训练 数据 的 词 频 算 阵 。 
。y: 训练 数据 的 类 别 标签 向 量 。 


(2) predict(0) 函 


predict (Xx) 


其 返回 值 为 MultinomialNB 对 象 。 


数 : 对 测试 集 进行 分 类 。 


参数 X 为 要 分 类 的 文档 的 词 频 和 矩阵， 矩阵 大 小 为 测试 集中 的 文档 数 x 特 征 数 。 


其 返回 值 为 X 的 预测 目标 值 向 量 ， 向 量 大 小 与 测试 集中 的 文档 数 一 致 。 


@Q dassification_report0 函 数 
该 函数 位 于 sklearn.metrics 模块 下 ， 用 于 显示 主要 分 类 指标 的 文本 报告 ， 在 报告 中 显 


示 每 个 类 的 准确 率 、 


主要 参数 如 下 。 


二 
外 
. 
e target names 
. 
四 


召回 率 、F1l 值 等 信息 。 


sklearn.metrics.classification report(Yy true, y pred, labels=None, 
target names=None, sample weight=None, digits=2) 


y_true: 一 维 数组 ， 或 标签 指示 器 数组 / 稀 朴 和 矩阵， 目标 值 。 

y_pred: 一 维 数组 ， 或 标签 指示 器 数组 /稀疏 矩阵 ， 分 类 器 返回 的 估计 值 。 
labels: 一 维 数组 ， 报 表 中 包含 的 标签 索引 列表 ， 可 选 。 

: 字符 串 列表 ， 与 标签 匹配 的 显示 名 称 ， 可 选 。 

sample weight: 一 维 数组 ， 样 本 权重 ， 可 选 。 

digits: int 型 ， 输 出 浮 点 值 的 位 数 ， 可 选 。 

其 返回 值 为 每 类 文本 的 准确 率 、 召 回 率 、F1-score 等 信息 ，string 类 型 。 


对 于 数据 测试 结果 有 下 面 4 种 情况 。 


TP: 预测 为 正 ， 


实际 为 正 ，FP: 预测 为 正 ， 实 际 为 负 ，FN: 预测 为 负 ， 实 际 为 正 ; 


TN: 预测 为 负 ， 实 际 为 负 。 
关于 准确 率 、 召 回 率 、F1-score， 详 细 定 义 如 下 : 
准确 率 =TP/ (TP+FP) 
召回 率 =TP/ (TP+FN) 
Fl—score= 2xTP/(2xTP + FP + FN) 
熟悉 了 这 些 类 和 函数 的 使 用 ， 就 可 以 实现 具体 的 案例 了 。 


18.6.2 ”案例 实现 


创建 一 个 名 为 sklearm NB.py 的 新 文件 , 用 Scikit-Learn 库 的 朴素 贝 叶 斯 算法 将 18.4 节 
和 18.5 节 的 例子 重新 进行 实现 。 


from sklearn 
from sklearn 


from sklearn. 


from sklearn 


import datasets 


.feature extraction.text import CountVectorizer 


naive bayes import MultinomialNB # 导 入 多 项 式 贝 叶 斯 算法 包 


-Cross_Validation import train test split 
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from sklearn.metrics import classification report 
间 留 言 板 案例 的 Scikit-Learn 实现 
def testNB skl() : 
posting=['my dog has flea problems help please', 'maybe not take him to 
dog park stupid', 
"my dalmation is so cute I love him','stop posting stupid 
worthless garbage', 
"mr licks ate my steak how to stop him', 'quit buying worthless 
dog food stupid'] 
classVec=[0,1,0,1,0,1] 
# 交 叉 验证 选择 训练 集 和 测试 集 
train data, test data,train y,test y=train test split(posting, 
classVec, test size=0.2,train size=0.8) 


# 生 成 文本 的 词 频 和 矩阵 

vectorizer=CountVectorizer() #CountVectorizer 用 于 词 袋 模型 统计 词 频 
wordXx=vectorizer.fit transform(train data) 

# 训 练 分 类 器 

clf=MultinomialNB() .fit (wordx, train y) 

# 预 测 测试 集 的 分 类 结果 

test wordxX=vectorizer.transform(test data) .toarray() 
predicted=clf.predict (test wordx) # 预 测 


for doc,category in zip(test data,predicted): 
print (doc,":",category) 
# 在 测试 集 上 的 性 能 评估 
classTarget _names=[' 正 常言 论 ',' 侮 辱 性 言论 '] 
print (classification report (test y,predicted, target names= 
classTarget names)) 
# 垃 圾 邮件 过 滤 的 Scikit-Learn 实现 
def spamTest skl() : 
# 加 载 email 文件 夹 下 的 数据 
base data=datasets.load files ("email/") 
# 交 叉 验证 选择 训练 集 和 测试 集 
train data,test data,train y,test y= 
train test split (base data.data,base data.target, test size= 
0.2,train size=0.8) 
# 生 成 文本 的 词 频 矩 阵 
Vectorizer=CountVectorizer (stop words="english", 
decode error='ignore') 
wordX=vectorizer.fit transform(train data) 
# 训 练 分 类 器 
clf=MultinomialNB() .fit (wordx, train y) 
# 预 测 测 试 集 的 分 类 结果 
test wordxXx=vectorizer :transform(test data) .toarray() 
#newDoc tfidf=trans former.transform (newDoc wordx) 
# 得 到 新 文档 每 个 词 的 TF-IDF 值 
predicted=clf.predict (test wordx) # 预 测 
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print (predicted) 
# 在 测试 集 上 的 性 能 评估 
print (classification report (test y,predicted, target names= 
base data.target names)) 
运行 skleam_NB.py， 在 Python 提示 符 下 输入 testNB_skl0， 可 以 得 到 留言 是 否 为 侮辱 
性 言论 的 预测 分 类 结果 及 预测 评估 报告 : 


maybe not take him to dog park stupid : 0 


quit buying worthless dog food stupid : 1 
Precision recall fl-score support 


正常 言论 0.00 0.00 0.00 0 
侮辱 性 言论 1.00 0.50 0.67 加 
avg/total 1.00 0.50 0.67 2 


在 Python 提示 符 下 输入 spamTest_skl()， 可 以 得 到 垃圾 邮件 过 滤 的 预测 分 类 结果 及 预 
测评 估 报 告 : 
OO DO 1] 
Precision recall fl-score support 


noSpam 1.00 1.00 1.00 6 
spam 1.00 1.00 1.00 4 
avg/total 1.00 1.00 1.00 10 


注意 : 因为 训练 集 和 测试 集 是 随机 划分 的 ， 所 以 每 次 的 运行 结果 不 一 定 相同 。 
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19.1 手写 体 识别 案例 需求 


人 类 对 图 19-1 所 示 的 一 串 手 写 图 像 可 以 毫 不 费力 地 认 出 是 504192, 这 
是 因为 人 体 的 视觉 系统 相当 神奇 ， 但 是 让 计算 机 进行 识别 就 比较 复杂 了 。 视频 让 他 
假如 给 定 一 个 数字 5 的 图 像 ， 计 算 机 如 何 描述 出 这 是 一 个 数字 5 呢 ? 我 们 
可 以 把 计算 机 当 作 一 个 小 孩子 ， 让 它 见 很 多 的 5 的 图 片 ， 慢 慢 就 形成 
了 自己 的 判断 标准 ， 而 这 种 让 计算 机 学 习 的 方法 就 是 神经 网 络 , 深度 SOL{I VS 又 
学 习 (Deep Learning) 就 是 具有 多 隐 含 层 的 神经 网 络 结构 。 

本 章 案例 将 采用 深度 学 习 框架 ， 使 用 卷 积 神经 网 络 (CNN) 对 “图 19-1 手写 体 数字 
MNIST 数据 集 进行 训练 ， 最 终 给 计算 机 一 个 任意 书写 的 手写 体 数字 ,使 它 能 够 识别 出 该 数 
字 是 什么 。 


19.2 ”深度 学 习 的 概念 及 关键 技术 


深度 学 习 (Deep Leaming) 是 机 器 学 习 (Machine Learming) 研究 中 的 一 个 新 领域 ， 是 
具有 多 隐 含 层 的 神经 网 络 结构 。 


19.2.1 神经 网 络 模型 


@ 生物 神经 元 
大 脑 大 约 由 140 亿 个 神经 元 组 成 ， 神 经 元 互相 连接 成 神经 网 络 ， 每 个 神经 元 平均 连接 
几 千 条 其 他 神经 元 。 神 经 元 是 大 脑 处 理 信息 的 基本 单元 ,一 个 神经 元 的 结构 如 图 19-2 所 示 。 
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Dendrites (receiving end) 树 突 〔 信 号 接收 端 ) 


轴 突 终端 


Terminal buttons 


Nucleus 细 胞 核 
Cytoplasm 细 胞 质 


Axon 轴 突 Nodes of Ranvier 
Hyelin sheath Ranvier 结 
轴 突 保护 层 


图 19-2 生物 神经 元 结构 


可 以 看 到 ， 一 个 可 视 化 的 生物 神经 元 是 由 细胞 体 、 树 突 和 轴 突 三 部 分 组 成 。 以 细胞 体 
为 主体 ， 由 许多 向 周围 延伸 的 不 规则 树枝 状 纤维 构成 ， 其 形状 像 一 棵 枯 树 的 枝 干 。 其 中 ， 
轴 突 负责 细胞 体 到 其 他 神经 元 的 输出 连接 ， 树 突 负责 接收 其 他 神经 元 到 细胞 体 的 输入 。 来 
自 神经 元 〔 突 触 ) 的 电化 学 信号 聚集 在 细胞 核 中 ， 如 果 聚 合 超过 了 突 触 闹 值 ， 那 么 电化 学 
尖峰 ( 突 触 》 就 会 沿 着 轴 突 向 下 传播 到 其 他 神经 元 的 树 突 上 。 
由 于 神经 元 结构 的 可 塑性 ， 突 触 的 传递 作用 可 增强 或 减弱 ， 因 此 神经 元 具有 学 习 与 遗 
忘 的 功能 。 

@ 人 工 神经 网 络 

人 工 神经 网 络 是 反映 人 脑 结构 及 功能 的 一 种 抽象 数据 模型 ， 它 使 用 大 量 的 人 工 神经 元 
进行 计算 ， 该 网 络 将 大 量 的 “神经 元 ”相互 连接 ， 每 个 “神经 元 ”是 一 种 特定 的 输出 函数 ， 
又 称 为 激活 函数 。 每 两 个 “神经 元 ”之 间 的 连接 都 通过 加 权 值 ， 称 为 权重 ， 这 相当 于 人 工 
神经 网 络 的 记忆 。 网 络 的 输出 则 根据 网 络 的 连接 规则 来 确定 ， 输 出 因 权重 值 和 激励 函数 的 
不 同 而 不 同 。 

一 个 简单 的 人 工 神经 网 络 如 图 19-3 所 示 ， 其 中 ，xi(b 等 数据 为 这 个 神经 元 的 输入 ， 代 
表 其 他 神经 元 或 外 界 对 该 神经 元 的 输入 ;ou 等 数据 为 这 个 神经 元 的 权重 , u = 玉 @; .xj( 


是 对 输入 的 求 和 ; y(t) =f(u(t)) 称 为 激励 函数 , 是 对 求 和 部 分 的 再 加 工 , 也 是 最 终 的 输出 。 
因此 , 神经 网 络 就 是 将 许多 单一 的 神经 元 连接 在 一 起 的 一 个 典型 的 网 络 ， 如 图 19-4 所 
示 ， 用 更 多 的 神经 元 去 进行 学 习 ， 神 经 网 络 最 左边 的 一 层 叫 输入 层 ， 它 有 3 个 输入 单元 ; 
最 右边 的 一 层 叫 输出 层 ， 它 只 有 一 个 结 点 ; 中 间 两 层 称 为 隐藏 层 ， 因 为 用 户 不 能 在 训练 过 
程 中 观测 到 它们 的 值 。 其 实 ， 神 经 网 络 可 以 包含 更 多 的 隐藏 层 。 


19.2.2 ”深度 学 习 之 卷 积 神经 网 络 


深度 学 习 的 概念 源 于 人 工 神经 网 络 的 研究 ， 含 有 多 隐 层 的 神经 网 络 就 
是 一 种 深度 学 习 结构 。 深 度 学 习 通 过 组 合 低 层 特征 形成 更 加 抽象 的 高 层 表 
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示 属 性 类 别 或 特征 ， 以 发 现 数据 的 分 布 式 特征 表示 。 


xi(D) i 
xa(D RS ja 


xs(t) 


X4(D 


xs(t) 


图 19-3 人工 神经 网 络 


Zioi x(t) 


图 19-4 神经 网 络 典型 结构 


深度 学 习 中 的 卷 积 神经 网 络 (CNN) 近年 来 有 了 非常 出 色 的 表现 ， 它 与 普通 的 神经 网 
络 的 区 别 在 于 包含 了 一 个 由 卷 积 层 和 池 化 层 构成 的 特征 抽取 器 。 在 卷 积 神经 网 络 的 卷 积 层 
中 ， 一 个 神经 元 只 与 部 分 邻 层 神经 元 相连 接 ， 通 常 包 含 若 干 个 特征 图 (Feature Map)， 每 
个 特征 平面 由 一 些 矩 形 排列 的 神经 元 组 成 。 同 一 特征 平面 的 神经 元 共享 权 值 ， 这 里 共享 的 
权 值 就 是 卷 积 核 ， 卷 积 核 一 般 以 随机 小 数 和 矩阵 的 形式 初始 化 ， 在 网 络 的 训练 过 程 中 卷 积 核 


将 学 习 得 到 合理 的 权 值 。 共 享 权 值 〈 卷 积 核 ) 带 来 的 直接 好 处 是 减少 了 网 络 各 层 之 间 的 连 


接 ， 同 时 又 降低 了 过 拟 合 的 风险 。 池 化 也 叫 子 采样 〈Pooling)， 可 以 看 作 一 种 特殊 的 卷 积 
过 程 。 卷 积 和 池 化 大 大 简化 了 模型 复杂 度 ， 减 少 了 模型 的 参数 。 
下 面具 体 介绍 几 个 相关 概念 。 


@ 卷 积 


这 里 用 一 个 简单 的 例子 来 讲述 如 何 计算 卷 积 ， 假 设 有 一 个 5x5 的 图 像 ， 使 用 一 个 3x3 
的 卷 积 核 (filter) 进行 卷 积 ， 想 得 到 一 个 3x3 的 Feature Map， 首 先 对 图 像 的 每 个 像素 进行 


编号 ， 用 Xij 表示 


图 像 的 第 i 行 第 j 列 元 素 ， 对 filter 的 每 个 权重 进行 编号 ， 月 


日 wmn 表示 第 


m 行 第 n 列 的 权重 ， 对 Feature Map 的 每 个 元 素 进行 编号 ， 用 aij 表示 第 i 行 第 j 列 元 素 。 
那么 Feature Map 中 aoo 的 卷 积 计算 方法 如 下 ， 如 图 19-5 所 示 。 


image 5x5 filter 3x3 Feature Map3x3 


图 19-5 卷 积 原理 图 1 


ao.0 一 QO0.0X0.0+O0.IXo.ITO02Xo2+TO1OXI0TO1LIXIITO12X12+Q2.0X2.0+O2.1X2.1 十 02.2X2.2 
二 1]x1+0x1+1x1l+0Ox0+1xl+0Oxl+1xO+Ox0+1x1 


=4 


Feature Map 中 ao. 的 卷 积 计算 方法 如 下 ， 如 图 19-6 所 示 。 
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a0.1—O0.1X0,1+ C0,2X0.2+0.3X0.3+O11X1.1+ O12X1.2+O13X1.3+02,1X2.1+02 2X2.2+002 3X2.3 
=]1xl1+0x]l+]1x0+0x1+1x1+0x1+]1x0+0x1+]x1 
=3 


bias=0 


image 5x5 filter 3x3 Feature Map 3x3 
图 19-6 卷 积 原理 图 2 


同 理 ， 依 次 计算 出 Feature Map 中 所 有 元 素 的 值 。 

在 上 面 的 计算 过 程 中 ， 步 幅 (stride) 为 1， 步 幅 可 以 设 为 大 于 1 的 数 。 例 如 ， 当 步 幅 
为 2 时 filter 将 每 次 滑动 两 个 元 素 ， 因 此 Feature Map 就 变 成 了 2x2。 这 说 明 图 像 大 小 、 步 
幅 和 卷 积 后 的 Feature Map 大 小 是 有 关系 的 ， 这 里 将 不 再 举例 。 

上 例 仅 演示 了 一 个 filter 的 情况 ， 其 实 每 个 卷 积 层 可 以 有 多 个 filter， 每 个 filter 和 原始 
图 像 进行 卷 积 后 都 可 以 得 到 一 个 Feature Map， 因 此 卷 积 后 Feature Map 的 深度 (个 数 ) 和 
卷 积 层 的 filter 个 数 是 相同 的 。 图 19-7 所 示 为 3 个 24x24 大 小 的 filter( 即 3x24x24) 得 到 
的 三 维 的 Feature Map。 


28x28 input neurons first hidden layer: 3x24x24 neurons 


图 19-7 多 个 卷 积 核 


以 上 就 是 卷 积 层 的 计算 方法 ， 这 里 体现 了 局 部 连接 和 权 值 共享 : 每 层 神经 元 只 和 上 一 
层 部 分 神经 元 相连 《〈 卷 积 计算 规则 )， 且 filter 的 权 值 对 于 上 一 层 所 有 神经 元 都 是 一 样 的 。 

@ 池 化 (Pooling ) 

Pooling 层 的 主要 作用 是 下 采样 ， 通 过 去 掉 Feature Map 中 不 重要 的 样本 进一步 减少 参 
数 数量 ， 且 可 以 有 效 地 防止 过 拟 合 。Pooling 的 方法 很 多 ， 最 常用 的 是 最 大 池 化 (Max 
Pooling)。 最 大 池 化 实际 上 就 是 在 nxn 的 样本 中 取 最 大 值 ， 作 为 采样 后 的 样本 值 。 

图 19-8 是 2x2 步 幅 为 2 的 最 大 池 化 ， 即 在 获取 的 Feature Map 中 每 2x2 的 矩阵 内 取 最 
大 值 作为 采样 后 的 结果 ， 这 样 能 把 数据 缩小 至 4， 同时 又 不 会 损失 太 多 信息 。 
对 于 深度 为 D 的 Feature Map， 各 层 独 立 做 Pooling， 因 此 Pooling 后 的 深度 仍然 为 D。 
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Max(1,1,5,6)=6 


max pool with 2x2 filters 
and stride 2 


Rectified Feature Map 


图 19-8 池 化 


@ 激活 函数 

激活 函数 的 作用 是 能 够 给 神经 网 络 加 入 一 些 非 线 性 因素 , 使 得 神经 网 络 可 以 更 好 地 解决 较 
为 复杂 的 问题 。 常 见 的 激活 函数 有 Sigmoid0 、tanh0、ReLUO 等 ， 这 里 简要 介绍 两 个 常用 的 
函数 Sigmoid0 和 ReLU(O。 

1) Sigmoid(O 函 数 

其 表达 式 如 下 : 


8(7)= l+e™ 


其 中 ，z 是 一 个 线性 组 合 ， 比 如 z 可 以 等 于 wo + wixxi + wz2xxz。 通 过 代入 很 大 的 正 数 或 很 
小 的 负数 到 函数 中 可 知 ，g(z) 的 结果 趋 近 于 0 或 1。 
因此 ，Sigmoid0) 函 数 的 图 形 表示 如 图 19-9 所 示 。 
也 就 是 说 ，Sigmoid0 函 数 的 功能 是 把 一 个 实 
数 压缩 至 0 一 1。 当 输入 非常 大 的 正 数 时 ， 输 出 结 
果 会 接近 1; 当 输入 非常 大 的 负数 时 ， 则 会 得 到 
接近 0 的 结果 。 压 缩 至 0 一 1 的 作用 是 可 以 把 激活 
函数 看 作 一 种 “分 类 的 概率 ”， 比 如 激活 函数 的 输 
出 为 0.9， 便 可 以 解释 为 90% 的 概率 为 正 样本 。 

2) ReLUO 函 数 


(x<0) 图 19-9 ”Sigmoid0 函 数 图 形 
y= 
x (x>0) 


在 ReLUO 函 数 中 , 当 x<0 时 函数 值 为 0, 否则 仍 为 x-ReLUO 函 数 的 图 形 表示 如 图 19-10 
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所 示 。 


图 19-10 ReLUO 函 数 图 形 


与 Sigmoid0 和 ReLUO 函 数 相 比 ，Sigmoid() 函 数 在 输入 参数 太 大 或 太 小 时 ， 会 产生 梯 
度 消失 现象 ， 而 ReLUO 对 于 随机 梯度 下 降 的 收 剑 有 巨大 的 加 速 作 用 ， 且 ReLUO 只 需要 一 
个 阔 值 就 可 以 得 到 激活 值 ， 而 不 用 进行 一 大 堆 复 杂 的 《指数 ) 运算 。 但 ReLUO 的 缺点 是 ， 
它 在 训练 时 比较 脆弱 ， 容 易 形成 不 可 逆转 的 死亡 ， 导 致 了 数据 多 样 化 的 丢失 。 

@ 卷 积 神经 网 络 的 网 络 结构 

一 个 卷 积 神经 网 络 通常 由 若干 卷 积 层 、Pooling 层 、 全 连接 层 组 成 。 用户 可 以 构建 各 种 
不 同 的 卷 积 神经 网 络 。 图 19-11 所 示 为 一 个 常见 的 卷 积 神经 网 络 模型 。 


cl Sl C2 S2 


I ~ 


"i 
. - 国 i 


Convolution Pooling Full 


Input 


Output 


Convolution c | 
+ReLU +ReLU ee 


Pooling 


图 19-11 一 个 典型 的 CNN 网 络 结构 


其 中 ，Input 为 输入 图 像 ， 被 计算 机 理解 为 矩阵 ， 输 入 图 像 通过 6 个 可 训练 的 filter 进 
行 卷 积 , 卷 积 后 产生 6 个 特征 图 (Feature Map), 然后 再 使 用 ReLUO 函 数 得 到 C1 层 的 Feature 
Map， 在 卷 积 层 后 面 是 池 化 (Pooling) 得 到 S2 层 。 卷 积 层 + 池 化 层 的 组 合 可 以 在 隐藏 层 出 
现 很 多 次 ， 例 如 图 19-11 中 出 现 了 两 次 ， 实 际 上 这 个 次 数 是 根据 模型 的 需要 而 来 的 。 用 上 
还 可 以 灵活 使 用 卷 积 层 + 卷 积 层 或 者 卷 积 层 + 卷 积 层 + 池 化 层 的 组 合 ， 这 些 在 构建 模型 的 时 
候 没有 限制 ， 但 是 最 常见 的 CNN 都 是 若干 卷 积 层 + 池 化 层 的 组 合 ， 如 图 19-11 中 的 CNN 
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结构 。 
在 若干 卷 积 层 + 池 化 层 后 面 是 全 连接 层 (Full Connected Layer，FC )， 全 连接 层 其 实 就 


是 传统 的 神经 网 络 结构 ， 即 前 一 层 的 每 一 个 神经 元 都 与 后 一 层 的 所 有 神经 元 相连 ， 在 整个 
卷 积 神经 网 络 中 起 到 “分 类 器 ”的 作用 。 


19.3 Python 深度 学 习 库 一 一 Keras 


Keras 是 搭建 在 theano/tensorflow 基础 上 的 深度 学 习 框 架 ， Python 视频 讲解 
语言 编写 ， 是 一 个 高 度 模块 化 的 神经 网 络 库 ， 支 持 GPU 和 CPU。 


19.3.1 Keras 的 安装 


@ 在 Windows 下 安装 Keras 
在 安装 Keras 之 前 需要 安装 tensorflow、numpy、matplotlib、scipy 等 库 。 


pip install numpy 
pip install matplotlib 
pip install scipy 
pip install tensorflow 
pip install keras 


四 使 用 Anaconda 安装 Keras 

在 “https://www.continuum.io/downloads/ ”下载 对 应 系统 版 本 的 Anaconda， 和 安装 普 
通 的 软件 一 样 , 全 部 选择 默认 即 可 , 注意 勾 选 将 Python3.6 添加 进 环境 变量 , 这 样 Anaconda 
就 安装 好 了 。 

打开 Anaconda 菜单 中 的 Anaconda Prompt， 输 入 : 


pip install --upgrade --ignore-installed tensorflow 
pip install keras 


© 测试 
安装 完成 后 ， 在 命令 行 下 输入 “python”， 进 入 Python 环境 后 输入 : 


import numpy 
import scipy 
import tensorflow as tf 
import keras 


若 没有 错误 提示 ， 则 表示 安装 完成 。 
19.3.2 ”Keras 的 网 络 层 


Keras 的 层 主要 包括 常用 层 (Core)、 卷 积 层 (Convolutional)、 池 化 层 (Pooling)、 


可 


| 372 


第 19 章 深度 学 习 案 例 一 一 基于 卷 积 神经 网 络 的 手写 体 识别 1 9 


部 连接 层 、 递 归 层 〈Recurrent)、 嵌 入 层 (Embedding)、 高 级 激活 层 、 规 范 层 、 噪 声 层 、 
包装 层 ， 当 然 用 户 也 可 以 编写 自己 的 层 。 


对 于 层 的 操作 如 下 : 

layer.get weights() # 返 回 该 层 的 权重 (numpy array) 
layer.set weights (weights) # 将 权重 加 载 到 该 层 
config=layer.get config() # 保 存 该 层 的 配置 
layer=layer from config(config) 加 载 一 个 配置 到 该 层 


# 如 果 层 仅 有 一 个 计算 结 点 〈 即 该 层 不 是 共享 层 )， 则 可 以 通过 下 列 方法 获得 输入 张 量 、 输 出 张 量 、 

# 输 入 数据 的 形状 和 输出 数据 的 形状 

layer.input 

layer.output 

layer.input shape 

layer.output shape 

# 如 果 该 层 有 多 个 计算 结 点， 可 以 使 用 下 面 的 方法 

layer.get input at (node index) 

layer.get output at (node index) 

layer.get input shape at (node index) 

layer.get output shape at (node index) 

下 面 介 绍 本 章 案 例 中 所 使 用 的 网 络 层 。 

@ 一 维 卷 积 层 

二 维 卷 积 层 是 对 图 像 的 卷 积 。 该 层 对 二 维 输入 进行 滑动 窗 卷 积 ， 当 使 用 该 层 作为 第 1 
层 时 ， 应 提供 input_shape 参数 。 例 如 input_shape=(128,128,3) 代 表 128x128 的 彩色 RGB 图 
像 (data_format='channels last')。 

操作 如 下 : 

keras.layers.convolutional .Conv2D (filters, kernel size, strides=(1, 1), 

padding='valid', data format=None, dilation rate=(1, 1), activation=None, 

use bias=True, kernel initializer='glorot uniform'， 

bias initializer='zeros', kernel regularizer=None, bias regularizer=None, 

activity regularizer=None, kernel constraint=None, bias constraint=None) 

参数 如 下 。 
filters: 卷 积 核 的 数目 〈 即 输出 的 维度 )。 
kernel size: 单个 整数 或 由 两 个 整数 构成 的 lisVytuple， 卷 积 核 的 宽度 和 长 度 。 如 为 各 
个 整数 ， 则 表示 在 各 个 空间 维度 的 相同 长 度 。 
strides: 单个 整数 或 由 两 个 整数 构成 的 list/tuple， 是 卷 积 的 步 长 。 如 果 为 单个 整数 ， 

则 表示 在 各 个 空间 维度 的 相同 步 长 。 任 何不 为 1 的 strides 与 任何 不 为 1 的 dilation_ 

rate 均 不 兼容 。 
padding: 补 0 策略 ， 为 'valid' 或 'same'。'valid' 代 表 只 进行 有 效 的 卷 积 ， 即 对 边界 数据 
不 处 理 。'same' 代 表 保 留 边界 处 的 卷 积 结果 , 通常 会 导致 输出 shape 与 输入 shape 相同 。 
activation: 激活 函数 ， 为 预定 义 的 激活 函数 名 (参考 激活 函数 ) 或 逐 元 素 


. 
运 
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(element-wise) 的 Theano 函数 。 如 果 不 指定 该 参数 ， 将 不 会 使 用 任何 激活 函数 ( 即 
使 用 线性 激活 函数 : aGx)=x)。 
。 dilation rate: 单个 整数 或 由 两 个 整数 构成 的 list/tuple， 指 定 dilated convolution 中 的 
膨胀 比例 。 任 何不 为 1 的 dilation rate 与 任何 不 为 1 的 strides 均 不 兼容 。 
data_format: 字符 串 ，'channels first' 或 'channels last 之 一 ， 代 表 图 像 的 通道 维 的 位 
置 。 该 参数 是 Keras 1.x 中 的 image_dim ordering，'channels_ last 对 应 原本 的 ' 世 ， 
'channels_first' 对 应 原本 的 "th'。 以 128x128 的 RGB 图 像 为 例 ，'channels_first 应 将 数 
据 组 织 为 (3,128,128)， 而 'channels_last' 应 将 数据 组 织 为 (128,128,3)。 该 参数 的 默认 值 
是 ~/.keras/keras.json 中 设置 的 值 ， 车 从 未 设置 过 ， 则 为 'channels last'。 
use_bias: 布尔 值 ， 是 否 使 用 偏 置 项 。 
kermel initializer: 权 值 初始 化 方法 ， 为 预定 义 初 始 化 方法 名 的 字符 串 ， 或 用 于 初始 
化 权重 的 初始 化 器 。 
bias_initializer: 偏 置 向 量 初始 化 方法 ， 为 预定 义 初始 化 方法 名 的 字符 串 ， 或 用 于 初 
始 化 偏 置 向 量 的 初始 化 器 。 


。 kernel regularizer: 施加 在 权重 上 的 正则 项 ， 为 Regularizer 对 象 。 

。 bias_regularizer: 施加 在 偏 置 向 量 上 的 正则 项 ， 为 Regularizer 对 象 。 
。 activity_regularizer: 施加 在 输出 上 的 正则 项 ， 为 Regularizer 对 象 。 
。 kernel_constraint: 施加 在 权重 上 的 约束 项 ， 为 Constraint 对 象 。 

。 bias_constraint: 施加 在 偏 置 上 的 约束 项 ， 为 Constraint 对 象 。 

@ Dense 层 (全 连接 层 ) 

操作 方法 如 下 : 


keras.layers.core.Dense (units,activation=None, use bias=True, kernel 
initializer='glorot uniform',bias initializer='zeros',kernel regularizer= 
None,bias regularizer=None,activity regularizer=None, kernel constraint= 
None,bias_ constraint=None) 


参数 如 下 。 

units: 大 于 0 的 整数 ， 代 表 该 层 的 输出 维度 。 

use_bias: 布尔 值 ， 是 否 使 用 偏 置 项 。 

kemel_initializer: 权 值 初始 化 方法 ， 为 预定 义 初始 化 方法 名 的 字符 串 ， 或 用 于 初始 
化 权重 的 初始 化 器 。 

bias_initializer: 偏 置 向 量 初 始 化 方法 ， 为 预定 义 初 始 化 方法 名 的 字符 串 ， 或 用 于 初 
始 化 偏 置 向 量 的 初始 化 器 。 

regularizer: 正则 项 ，kemel 为 权重 的 ，bias 为 偏执 的 ，activity 为 输出 
constraint: 约束 项 ，kernel 为 权重 的 ，bias 为 偏执 的 。 

@ Activation 层 

操作 方法 如 下 : 

keras.1layers.core.Activation (activation) 

激活 层 对 一 个 层 的 输出 施加 激活 函数 。 

activation 是 将 要 使 用 的 激活 函数 ， 为 预定 义 激 活 函数 名 或 一 个 Tensorflow/Theano 的 


7 
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输入 shape 任意 ， 当 使 用 激活 层 作 为 第 1 层 时 要 指定 input_shape。 

输出 shape 与 输入 shape 相同 。 

@ 最 大 池 化 层 MaxPooling2D 

操作 方法 如 下 : 

keras.layers.pooling.MaxPooling2D (pool size=(2,2),strides=None,padding= 
'valid', data format=None) 


参数 如 下 。 

pool size: 整数 或 长 为 2 的 整数 tuple， 代 表 在 两 个 方向 ( 竖 直 、 水 平 ) 上 的 下 采样 
因子 ， 例 如 取 (2,2) 将 使 图 片 在 两 个 维度 上 均 变 为 原 长 的 一 半 。 它 为 整数 ， 意 为 各 个 
维度 值 相同 且 为 该 数字 。 

strides: 整数 或 长 为 2 的 整数 tuple， 或 者 为 None， 步 长 值 。 

padding: "Valid' 或 者 'same'。 

data_format: 字符 串 ，'channels_first' 或 'channels_ last 之 一 ， 代 表 图 像 的 通道 维 的 位 
置 。 该 参数 是 Keras 1.x 中 的 image_dim ordering，'channels last 对 应 原本 的 't， 
'channels first' 对 应 原本 的 'th'。 


19.3.3 用 Keras 构建 神经 网 络 


日 Keras 构建 网 络 的 过 程 可 用 图 19-12 所 示 。 


二 


/ 有 约束 项 上 
、、 
每 层 都 可 以 包括 各 种 网 络 层 
\ 图 ~ 


| 且 

\ | 

\ ”4] step4: 训 练 上 卫 数 

\ re SR 

b ee 

\ 提供 格式 化 数据 、、 
提供 格式 化 数据 ~ 


图 19-12 用 Keras 搭建 神经 网 络 
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下 面 以 一 个 简单 的 例子 演示 使 用 Keras 如 何 构建 网 络 结构 并 进行 训练 及 预测 。 
首先 引入 库 ， 并 建立 一 个 顺序 模型 ，Sequential 就 是 一 个 空 的 网 络 结构 ， 方 法 如 下 : 


from keras.models import Sequential 
model=Sequential () 


在 Keras 里 面 可 以 构建 一 些 其 他 的 网 络 结构 ， 仅 需要 写 .add， 后 面 加 入 层 的 类 型 


下 例 中 引入 了 Dense (也 就 是 层 ) 和 激活 函数 层 (RELU): 


from keras.layers import Dense, Activation 
# 再 分 别 add fc、relu、fc、softmax 层 
model.add (Dense (units=64, input dim=100)) 
model .add (Activation ("relu")) 

model .add (Dense (units=10)) 

model .add (Activation ("softmax")) 


编译 模型 ， 损 失 函 数 loss 用 交叉 炉 ， 优 化 器 用 sgd， 评 估 用 accur 


acy: 


即 可 。 


model .compile (loss='categorical crossentropy', optimizer='sgd', metrics= 


laccuracy ly 
载 入 训练 数据 集 进行 训练 : 
model .fit (x train, y train, epochs=5, batch size=32) 


对 测试 集 进 行 如 下 操作 : 


evaluate loss and metrics = model.evaluate (x test, y test, batch size=128) 


19.4 程序 设计 的 思路 


@ 数据 集 描述 


在 本 实例 中 ， 训 练 样本 和 识别 测试 数据 都 是 28x28 像素 ， 如 图 19-13 


所 示 的 图 片 ， 它 在 计算 机 中 的 存储 是 一 个 二 维和 矩阵 ，0 代表 白色 ，1 代表 黑色 ， 小 数 代表 某 


程度 的 灰色 。 那 么 输入 层 就 应 该 是 28x28=786 个 神经 元 (忽略 它 的 二 维 结构 )， 其 


神经 元 的 输入 数据 就 是 该 像素 的 灰 度 值 。 整 个 数据 集 被 分 成 两 部 分 ， 

据 集 和 10000 行 的 测试 数据 集 ，60000 行 的 训练 数据 集 是 一 个 形状 为 
第 1 个 维度 数字 用 来 索引 图 片 ， 第 2 个 维度 数字 用 来 索引 每 张 图 片 中 
中 的 每 一 个 元 素 都 表示 某 张 图 片 中 的 某 个 像素 的 强度 值 ， 值 的 取 值 范 


识别 的 结果 。 

@ 网 络 结构 

网 络 层级 结构 概述 : 5 层 神经 网 络 。 
输入 层 : 输入 数据 为 原始 训练 图 像 。 


即 60000 行 的 Y 


中 每 个 


1 练 数 


[60000,784] 的 张 量 ， 


的 像素 点 。 在 1 
围 为 0 一 1。 


比 张 量 


输出 结果 只 有 10 个 数字 〈 即 10 类 )， 输 出 层 是 10 个 神经 元 ， 每 个 神经 元 对 应 一 个 要 


第 一 卷 积 层 : 6 个 5x5 的 卷 积 核 ， 步 长 Stride 为 1。 在 这 一 层 中 ,输入 为 28x28 的 深度 
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为 1 的 图 片 数 据 ， 输 出 为 24x24 的 深度 为 6 的 特征 图 。 


o0 0 0 0 0 0o 0 
BE 
| 
0 0 0 0 0 "0 转 
0 0 0" oo 0 画 
ooo oo o 图 

oo 0 oo 0o " 

|o 0o00 oo 0o 0 
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0 0 0 00 0 0 
oo 0 0 00 0 0 


图 19-13 输入 图 像 
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第 一 池 化 层 : 卷 积 核 size 为 2x2， 步 长 Stride 为 2 的 最 大 池 化 。 在 这 一 层 中 ， 输 入 为 
24x24 的 深度 为 6 的 特征 图 ， 输 出 为 12x12 的 深度 为 6 的 特征 图 。 
第 二 卷 积 层 : 12 个 5x5 的 卷 积 核 ， 步 长 Stride 为 1。 在 这 一 层 中 ， 输 入 为 12x12 的 深 


度 为 6 的 图 片 数据 ， 输 出 为 8x8 的 深度 为 12 的 特征 图 。 


第 二 池 化 层 : 卷 积 核 size 为 2x2， 步 长 Stride 为 2 的 最 大 池 化 。 在 这 一 层 中 ， 输 入 为 


8x8 的 深度 为 12 的 特征 图 ， 输 出 为 4x4 的 深度 为 12 的 特征 图 。 
输出 层 : 输出 为 10 维 向 量 ， 激 活 函数 为 sigmoid。 
@ 代码 流程 简 述 
(1) 获取 训练 数据 和 测试 数据 。 


(2) 训练 网 络 的 超 参 数 的 定义 学 习 率 ， 每 次 迭代 中 训练 的 样本 数目 ， 迭 代 次 数 )。 


(3) 构建 网 络 层级 结构 。 
(4) 编译 模型 。 

(5) 训练 模型 。 

(6) 网 络 模型 评估 。 


19.5 ”程序 设计 的 步骤 


19.5.1 ”MNIST 数据 集 


MNIST (Mixed National Institute of Standards and Technology database) 是 一 个 计算 机 


视觉 数据 集 , 它 包 含 70000 张 手写 数字 的 灰 度 图 片 , 其 中 每 一 张 
手写 体 数据 集 (MNIST) 文件 的 下 载 如 下 。 


图 片 包含 28x28 个 像素 点 。 


训练 集 样本 : t10k-images.idx3-ubyte (下 载 地 址 为 “http://luanpeng.0ss-cn-qingdao. 
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aliyuncs.com/csdn/python/%E6%89%8B%ES5%86%99%E4%BDY%I93W%E6%I9S%BOW%E6%SD% 
AFE/tl0k-images.idx3-ubyte” )。 

训练 集 标签 :t10k-labels.idx1-ubyte( 下载 地 址 为 “http://Iluanpeng.0ss-cn-qingdao.aliyuncs. 
com/csdn/python/%E6%89%8B%ES%86%99%E4%BD%93%E6%95%BOWE6%S8DW%AE/tIOk- 
labels.idxl-ubyte”)。 

测试 集 样本 : train-images.idx3-ubyte (下 载 地 址 为 “http://luanpeng.0ss-cn-qingdao. 
aliyuncs.com/csdn/python/%E6%89%8B%ES5%86%99%E4%BDY%I93%E6%I9S5%BOWE6%SD% 
AFE/train-images.idx3-ubyte” )。 

测试 集 标签 : train-labels.idx1-ubyte( 下 载 地 址 为 “http://Iluanpeng.o0ss-cn-qingdao.aliyuncs. 
com/csdn/python/%E6%89%8B%ES5%86%99%E4%BDY%93%E6%ISW%BOWE6%8SD%AE/train- 
labels.idxl-ubyte ” )。 


19.5.2 手写 体 识别 案例 实现 


@ 读 取 MNIST 数据 集 

编写 文件 MNISTpy， 用 于 获取 手写 图 像 数据 ， 每 张 图 像 是 28x28 像素 大 小 ， 根 据 需 
要 转换 成 长 度 为 784 的 行 向 量 。 

每 个 对 象 的 标签 为 0 一 9 的 数字 ，one-hot 编码 成 10 维 的 向 量 。 


#MNIST.py 文件 
import numpy as np 
# 数 据 加 载 器 基 类 ， 派 生出 图 片 加 载 器 和 标签 加 载 器 
class Loader (object): 
# 初 始 化 加 载 器 ，path 为 数据 文件 路 径 ，count 为 文件 中 的 样本 个 数 
def _ init _(self, path, count): 
self .path=path 
self.count=count 
# 读 取 文 件 内 容 
def get file content (self): 
print (self.path) 
f=open (self.path, ‘rb') 


content=f.read() # 读 取 字 节 流 
f.close() 
return content # 字 节 数 组 

# 图 像 数 据 加 载 器 


class ImageLoader (Loader): 
# 内 部 函数 ， 从 文件 字 节 数组 中 获取 第 index 个 图 像 数据 ， 文 件 中 包含 所 有 样本 图 片 的 数据 
def get picture(self, content, index): 
start=index*28*28+16 
# 文 件 头 16 字 节 , 后 面 每 28x28 个 字 节 为 一 个 图 片 数据 
picture=[] 


for i in range(28): 
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picture.append([]) # 图 片 添 加 一 行 像素 
for j in range(28): 
bytel = content[start+i*28+j] 
picture[i] .append (bytel) # 在 Python3 中 本 来 就 是 int 
#picture[i] .append (self.to int (bytel)) # 添 加 一 行 的 每 一 个 像素 
return picture 
图 月 为 0[X7 0] 7 [的 列表 
# 将 图 像 数据 转化 成 长 度 为 784 的 行 向 量 形式 
def get one sample (self, picture): 
sample=[] 
for i in range(28): 
for j in range (28) : 
sample.append (picture[i] [j]) 
return sample 


加 载 数据 文件 ， 获 得 全 部 样本 的 输入 向 量 ，onerow 表示 是 否 将 每 张 图 片 转化 为 行 向 量 ，to2 


# 表 示 是 否 转化 为 0, 1 矩阵 

def load(self,onerow=False) : 
content=self.get file content() # 获 取 文 件 字 节 数 组 
data set=[] 
for index in range(self.count) : # 人 遍历 每 一 个 样本 


onepic=self.get picture(content, index) 
# 从 样本 数据 集中 获取 第 index 个 样本 的 图 片 数 据 ， 返 回 的 是 二 维 数组 
if onerow: onepic=self.get one sample (onepic) 
# 将 图 像 转化 为 一 维 向 量 形式 
data set.append (onepic) 
return data set 
# 标 签 数据 加 载 器 
class LabelLoader (Loader): 
# 加 载 数 据 文件 ， 获 得 全 部 样本 的 标签 向 量 
def load(self) : 


content=self.get file content () # 获 取 文件 字 节 数组 

labels=[] 

for index in range(self.count) : # 饥 历 每 一 个 样本 
onelabel=content [index + 8] # 文 件 头 有 8 个 字 节 
onelabelvec=self.norm(onelabel) #one-hot 编码 


labels.append (onelabelvec) 
return labels 
# 内 部 函数 ，one-hot 编码 ， 用 于 将 一 个 值 转换 为 10 维 标 签 向 量 
def norm(self, label): 
label vec=[] 
#label value=self.to int(label) 
label value=label # 在 Python3 中 直接 就 是 int 


for i in range(10): 
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if i==label value: 
label vec.append(1) 
else: 
label vec-append (0) 
return label vec 
# 获 得 训练 数据 集 ，onerow 表示 是 否 将 每 张 图 片 转化 为 行 向 量 
def get training data set (num,onerow=False): 
image loader=ImageLoader('train-images.idx3-ubyte', num) 
# 参 数 为 文件 路 径 和 加 载 的 样本 数量 
label loader=LabelLoader('train-labels.idxl-ubyte', num) 
# 参 数 为 文件 路 径 和 加 载 的 样本 数量 
return image loader.load(onerow), label loader.1o0ad() 
# 获 得 测试 数据 集 ，onerow 表示 是 否 将 每 张 图 片 转化 为 行 向 量 
def get test data set (num,onerow=False): 
image loader=ImageLoader('t1l0k-images.idx3-ubyte', num) 
# 参 数 为 文件 路 径 和 加 载 的 样本 数量 
label loader=LabelLoader('t1l0k-labels.idxl-ubyte', num) 
# 参 数 为 文件 路 径 和 加 载 的 样本 数量 
return image loader.1oad (onerow), label loader.1o0ad() 
# 将 一 个 长 度 为 784 的 行 向 量 打印 成 图 形 的 样式 
def printimg (onepic): 
onepic=onepic.reshape (28, 28) 
for i in range(28): 
for j in range(28) : 


if onepic[i,j]==0: print(' ',end="'') 
else: print('* ',end="'') 
print('") 
@ 训练 及 测试 数据 集 


import numpy as np 

np.random.seed(1337) # 可 重 现 性 

from keras.models import Sequential 

from keras.layers import Dense, Dropout, Activation, Flatten 
from keras.layers import Conv2D, MaxPooling2D,AveragePooling2D 
import MNIST 


# 全 局 变量 

batch size=128 # 批 处 理 样本 数量 

nb classes=10 # 分 类 数目 
epochs=600 # 迁 代 次 数 

img rows, img cols=28, 28 # 输 入 图 片 样本 的 宽 、 高 
nb filters=32 # 卷 积 核 的 个 数 

pool size=(2, 2) # 池 化 层 的 大 小 
kernel size=(5, 5) # 卷 积 核 的 大 小 

input shape=(img rows, img cols,1) # 输 入 图 片 的 维度 
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X train, Y train=MNIST.get training data set(6000, False) 
## 加 载 训练 样本 数据 集 和 one-hot 编码 后 的 样本 标签 数据 集 ， 最 大 为 60000 
X test, Y test=MNIST.get test data set(1000, False) 
# 加 载 测试 特征 数据 集 和 one-hot 编码 后 的 测试 标签 数据 集 ， 最 大 为 10000 
X train=np.array(X train) .astype (bool) .astype (float)/255 
# 数 据 归 一 化 
X train=X train[:,:,:,np.newaxis] 
# 添 加 一 个 维度 ， 代 表 图 片 通道 ， 这 样 数据 集 共 4 个 维度 ， 即 样本 个 数 、 宽 度 、 高 度 、 通 道 数 
Y train=np.array(Y train) 
X_test=np.array(X test) .astype (bool1) .astype (float)/255 # 数 据 归 一 化 
X test=X test[:,:,:,np.newaxis] 
# 添 加 一 个 维度 ， 代 表 图 片 通道 ， 这 样 数据 集 共 4 个 维度 ， 即 样本 个 数 、 宽 度 、 高 度 、 通 道 数 
Y test=np.array(Y test) 
print (' 样 本 数据 集 的 维度 : '，X train.shape,Y train.shape) 
print (' 测 试 数据 集 的 维度 : '，X test.shape,Y test.shape) 
# 构 建 模型 
model=Sequential () 
model.add (Conv2D (6, kernel size,input shape=input shape,strides=1)) 


# 卷 积 层 1 
model .add (AveragePooling2D (pool size=pool size,strides=2)) # 池 化 层 
model .add (Conv2D (12, kernel size,strides=1)) 井 卷 积 层 2 
model.add (AveragePooling2D (pool size=pool _size, strides=2) ) # 池 化 层 
model .add (Flatten ()) # 拉 成 一 维 数据 
model.add (Dense (nb _classes)) # 全 连接 层 2 
model .add (Activation ('sigmoid')) #sigmoid 评分 


# 编 译 模型 

model .compile (loss='categorical crossentropy',optimizer='adadelta', 
metrics=['accuracy']) 

# 训 练 模型 

model.fit(x train, Y train, batch size=batch size, epochs=epochs, 
verbose=1, validation data=(X test, Y test)) 

# 评 估 模 型 

Score=model.evaluate (X test, Y test, verbose=0) 

print('Test score:', score[0]) 

print('Test accuracy:', score[1]) 

# 保 存 模型 

model.save('cnn model.h5') #8DF5 文件 , pip install h5py 


输出 结果 如 下 : 


Test score: 0.18881544216349722 
Test accuracy: 0.959 


于 训练 时 间 太 久 ， 读 者 可 自行 减少 训练 集 及 测试 集 的 数量 ， 或 者 迭代 次 数 ， 观 察 训 


练 结果 。 
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19.5.3 ”预测 自己 手写 图 像 


@ 制作 自己 的 手写 图 像 
使 用 画图 工具 或 Photoshop 制作 一 个 28x28 像素 的 ! 字 的 图 像 文件 ， 如 图 
所 示 。 
图 19-14 自己 的 手写 图 像 
四 编写 代码 


新 建文 件 my_predictpy， 编 写 代码 如 下 : 


from keras.models import load model 
import numpy as np 

import cv2 

model=load model('cnn model.h5') 
image=cv2.imread('4.png', 0) 
img=cv2.imread('4.png', 0) 
img=np.reshape (img, (1,28,28,1)) .astype (bool) .astype ("float32") /255 
my proba=model .predict proba (img) 

my predict=model .predict classes (img) 
Print (' 识 别 为 :，' ) 

print (my proba) 

print (my predict) 

cv2.imshow ("Imagel", image) 

cv2 .waitKey (0) 
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20.1 功能 介绍 


“ 词 云 ” 就 是 对 网 络 文本 中 出 现 频率 较 高 的 “关键 词 ” 予以 视觉 上 的 突 
出 ， 形 成 “关键 词 云层 ”或 “关键 词 泻 染 ”， 从 而 过 滤 掉 大 量 的 文本 信息 ， 
使 浏览 网 页 者 只 要 一 眼 扫 过 文本 就 可 以 领略 文本 的 主旨 。 

豆 办 电影 提供 了 最 新 的 电影 介绍 及 评论 ， 包 括 上 映 影片 的 影讯 查询 及 购 票 服务 ， 观 众 
可 以 记录 想 看 、 在 看 和 看 过 的 电影 /电视 剧 ， 以 及 打分 、 写 影评 。 豆 辩 电 影 会 根据 观众 的 口 
味 推荐 好 电影 。 本 程序 使 用 Python 疏 虫 技术 获取 豆瓣 电影 (https:/movie.douban.com/) 中 
最 新 电影 的 影评 ， 经 过 数据 清理 和 词 频 统计 后 对 电影 《 黑 豹 》 的 影评 信息 进行 词 云 展示 ， 
效果 如 图 20-1 所 示 。 


398201 y=83.65558 。 255 255, 255] 


图 20-1 《 黑 豹 》 影 评 信息 的 词 云 显示 结果 
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20.2 程序 设计 的 思路 


本 程序 主要 分 为 3 个 过 程 。 
@ 抓 取 网 页 数据 
使 用 Python 怜 虫 技术 获取 豆瓣 电影 中 最 新 上 映 电 影 的 网 页 (如 图 20-2 所 示 )， 其 网 址 
如 下 : 
https://movie.douban.com/cinema/nowplaying/zhengzhou/ 


电影 票 - 郑州 masa 
正在 上 映 


唐人 街 探 宗 2 小 萝 和 的 猴 神 大 
灾 赤 直 评 六 了 1 妈妈 妈妈 二 6 6 


图 20-2 最 新 上 映 电影 的 网 页 


通过 其 HTML 解析 出 每 部 电影 的 ID 号 和 电影 名 , 获取 某 ID 号 就 可 以 得 到 该 部 电影 的 
影评 网 址 ， 形 式 如 下 : 

https://movie.douban.com/subject/26861685/comments 
其 中 ，26861685 就 是 电影 《红海 行动 》 的 ID 号 。 这 样 仅仅 获取 了 20 个 影评 ， 可 以 指定 开 
始 号 start 来 获取 更 多 影评 ， 例 如 : 

https://movie.douban.com/subject/26861685/comments?start=40&limit=20 

这 意味 着 获取 从 第 40 条 开始 的 20 个 影评 。 

@ 清理 数据 

通常 将 某 部 影评 信息 存 入 eachCommentList 列表 中 。 为 便于 数据 清理 和 词 频 统 计 ， 把 
eachCommentList 列表 形成 字符 串 comments， 将 comments 字符 串 中 的 “也 ”“ 太 ”“ 的 ” 
等 虚词 〈 停 用 词 ) 清理 掉 后 进行 词 频 统计 。 

@ 用 词 云 进行 展示 

最 后 使 用 词 云 包 对 影评 信息 进行 词 云 展示 。 
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20.3 ”关键 技术 


视频 讲解 


20.3.1 安装 WordCloud 


WordCloud 使 用 最 常规 的 pip install wordcloud 命令 安装 。 

如 果 安 装 失败 ， 可 以 使 用 Windows 二 进 制 安装 包 (WHL 文件 ) 直接 安装 ， 步 又 如 下 : 

首先 转 到 “http://www.lfd.uci.edu/~gohlke/pythonlibs/#wordcloud” 页 面 ， 下 载 需 要 的 对 
应 版 本 的 WordCloud 的 WHL 文件 。 如 果 用 户 使 用 的 是 64bit 的 Python3.5， 请 下 载 图 20-3 
中 框 住 的 文件 。 


Rordcloud, a little word cloud generator. 
wordcloud-1. 3. 1-cp27-cp27m-win32. whl 
wordcloud-1. 3. 1-cp27-cp27m-win_amd64. whl 
wordcloud-1. 3. 1-cp34-cp34m-win32. whl 
wordcloud-1. 3. 1-cp3d-cp3dm-win_amd64. whl 


wordcloud-1. 3. 1-cp35-cp35m-win32. whl 


wordcloud. 


wordcloud-1. 3. 1-cp36-cp36m-win_amd64. whl 


图 20-3 ”下载 文件 


然后 在 cmd 命令 行 中 进入 到 刚刚 下 载 的 文件 的 路 径 ， 使 用 pip install 
wordcloud-1.3.1-cp35-cp35m-win_amd64.whl 命令 开始 安装 ， 大 约 一 分 钟 就 可 以 安装 完成 。 


20.3.2 ”使 用 WordCloud 


@@ WordCloud 的 基本 用 法 


class wordcloud.WordCloud (font path=None, width=400, height=200, margin=2, 
ranks only=None, prefer horizontal=0.9, mask=None, scale=1, 


color func=None, max words=200, min font size=4, stopwords=None, 
random state=None, background color='black', max font size=None, 
font step=1, mode='RGB', relative scaling=0.5, regexp=None, 
collocations=True, colormap=None, normalize plurals=True) 


这 是 WordCloud 的 所 有 参数 ， 下 面具 体 介 绍 一 下 各 参数 。 

。 font path: 需要 展现 什么 字体 就 把 该 字体 路 径 + 扩 展 名 写 上 ， 例 如 font path = ' 黑 
体 .ttf'。 

。 width: 输出 的 画布 宽度 ， 默 认为 400 像素 。 
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height: 输出 的 画布 高 度 ， 默 认为 200 像素 。 

prefer_horizontal: 词语 水 平方 向 排版 出 现 的 频率 ， 默 认为 0.9〈 所 以 词语 垂直 方向 
排版 出 现 的 频率 为 0.1)。 

mask: 如 果 该 参数 为 空 ， 则 使 用 二 维 遮 单 绘制 词 云 ， 如 果 该 参数 非 空 ， 设 置 的 宽 / 
高 值 将 被 忽略 ， 遮 罩 形 状 将 被 mask 取代 。 除 了 全 白 〈 克 FFFFF) 部 分 不 会 绘制 以 
外 ， 其 余部 分 会 用 于 绘制 词 云 。 例 如 bg pic = imread(' 读 取 一 张 图 片 .png)， 背 景 图 
片 的 画布 一 定 要 设置 为 白色 (三 FFFFF)， 然 后 显示 的 形状 为 不 是 白色 的 其 他 颜色 。 
用 户 可 以 用 PS 工具 将 自己 要 显示 的 形状 复制 到 一 个 纯 白 色 的 画布 上 ， 然 后 保存 。 
Scale: 按照 比例 放大 画布 ， 例 如 设置 为 1.5， 则 长 和 宽 都 是 原来 画布 的 1.5 倍 。 
min_font_size: 显示 的 最 小 的 字体 大 小 。 

font_step: 字体 步 长 ， 如 果 步 长 大 于 1， 会 加 快运 算 ， 但 是 可 能 导致 结果 出 现 较 大 
的 误差 。 

max_words: 要 显示 的 词 的 最 大 个 数 。 

stopwords: 设置 需要 屏蔽 的 词 ， 如 果 为 空 ， 则 使 用 内 置 的 STOPWORDS。 
background_color: 背景 颜色 ， 例 如 background_color='white'"， 背 景 颜色 为 白色 ， 默 
认 颜 色 为 黑色 。 

max_font_size: 显示 的 最 大 的 字体 大 小 。 

mode: 当 该 参数 为 “RGBA ”并且 background_color 不 为 空 时 背景 透明 。 
relative_scaling: 词 频 和 字体 大 小 的 关联 性 。 

color func: 生成 新 颜色 的 函数 ， 如 果 为 空 ， 则 使 用 selfcolor func。 

regexp: 使 用 正则 表达 式 分 隔 输 入 的 文本 。 

collocations: 是 否 包括 两 个 词 的 搭配 。 

colormap: 给 每 个 单词 随机 分 配 颜 色 ， 若 指定 color funce， 则 忽略 该 方法 。 


WordCloud 提供 的 方法 如 下 。 


fit_ words(frequencies): 根据 词 频 生成 词 云 。 

generate(text): 根据 文本 生成 词 云 。 

generate_ from frequencies(frequencies[,…]): 根据 词 频 生 成 词 云 。 
generate_ from _text(text): 根据 文本 生成 词 云 。 

process_text(text): 将 长 文本 分 词 并 去 除 屏蔽 词 ( 此 处 指 英语 ， 中 文 分 词 还 需要 自己 
用 其 他 库 先 行 实现 ， 使 用 上 面 的 fit_ words(frequencies))。 
recolor([random_state,color_func.colormap]): 对 现 有 输出 重新 着 色 ， 重新 着 色 会 比重 
新 生成 整个 词 云 快 很 多 。 

to_array(): 转化 为 numpy array。 

to_file(filename): 输出 到 文件 。 


四 WordCloud 的 应 用 举例 


# 导 入 wordcloud 模块 和 matplotlib 模块 
from wordcloud import WordCloud,ImageColorGenerator,STOPWORDS 
import matplotlib.pyplot as plt 


from scipy.misc import imread 
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text=open ('test.txt', 'r') .read() # 读 取 一 个 TXT 文件 
bg pic=imread('alice.png') # 读 入 背景 图 片 
nr ' 设 置 词 云 样式 ' 1 


wc=WordCloud( 
background color=" white', 
#background color 参数 用 于 设置 背景 颜色 ， 默 认 颜色 为 黑色 
mask=bg pic, 
# 有 中 文 这 句 代码 必须 添加 ， 和 否则 会 只 出 现 方 框 而 不 出 现 汉字 
font path='simhei.ttf'， # 通 过 font path 参数 来 设置 字体 集 
max words=2000, 
max font size=150, 
random state=30,scale=1.5) 


wc.generate from text (text) # 根 据 文本 生成 词 云 
image colors=ImageColorGenerator (bg pic) 
plt.imshow (wc) 显示 词 云图 片 


plt.axis('off') 

plt.show() 

print('display success!') 

wc.to filel('test2.jpg') # 保 存 图 片 


只 有 在 设置 mask 的 情况 下 才 会 得 到 一 个 拥有 图 片 形状 的 词 云 。 本 程序 使 用 的 模板 图 
是 alice.png( 如 图 20-4 所 示 )， 生 成 的 词 云 形 状 如 图 20-5 所 示 。 


图 20-4 模板 图 图 20-5 生成 的 词 云图 


人 @ 设置 停 用 词 
用 户 也 可 以 设置 停 用 词 “ 太 ”“ 的 ”等 虚词 )， 使 得 词 云 中 不 显示 该 虚词 ， 例 如 : 


from os import path 


from PIL import Image 
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import numpy as np 

import matplotlib.pyplot as plt 

from wordcloud import WordCloud, STOPWORDS, ImageColorGenerator 
# 读 取 整 个 文章 

text=open('test.txt','r') .read() # 读 取 一 个 TXT 文件 

# 读 取 遮 单 / 彩 色 图 像 

alice coloring=np.array (Image.open (path.join(d, "alice color.png"))) 
# 设 置 停 用 词 

stopwords=set (STOPWORDS) 

stopwords .add ("的 ") # 人 工 添加 停 用 词 

stopwords .add(" 了 ") # 人 工 添 加 停 用 词 

# 可 以 通过 mask 参数 来 设置 词 云 形状 

wc=WordCloud (background color="white", max words=2000, mask=alice 
coloring, stopwords=stopwords, max font size=40, random state=42) 
# 生 成 词 云 

wc.generate (text) 

# 根 据 图 片 生成 颜色 

image colors=ImageColorGenerator (alice coloring) 

plt.imshow (wc, interpolation="bilinear") 

pltsaxis("oFt"} 

plt.show() 


人 @ WordCloud 使 用 词 频 


import jieba.analyse 
from PIL import Image, ImageSequence 
import numpy as np 
import matplotlib.pyplot as plt 
from wordcloud import WordCloud, ImageColorGenerator 
lyric="" 
f=open('./test.txt','r') 
:7 二 
lyric+=f.read() 
# 用 jieba 对 文章 做 分 词 ， 提 取出 词 频 高 的 前 50 个 词 
result=jieba.analyse.textrank (lyric, topK=50,withWeight=True) 
keywords=dict () 
FOr i Tn TosDLlE: 
keywords [i [0] ]=i [1] 
print (Kkeywords) 


输出 如 下 : 


{'” 听见 ':0.26819943990969086,， 风 雨 ':0.4369472045572426,， 不 能 ': 
0.41455711258992367, ' 生 命 ':0.5934235845918548，' 理 想 ' :0.26510877668765925, ' 星 河 ' : 
0.23975886019089002, ' 青 春 ' :0.24010255181105905, ' 希 望 ':0.494835681401572, ' 痛 算 ': 
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0.27939232288036236, ' 梦 想 ' :0.6607157592927637, ' 大 家 ' :0.2630206522238169,，' 日落 ' : 
0.24124829031114808,' 相信 ':1.0,， 随 风 ':0.24679509210701486,， 热血 ": 
0.3747213789071734, ' 怒 放 ' :0.4236733731776506, ' 忘掉 ' :0.37456984152879724，' 卷 起 ' : 
0.28349442481975, ' 兄弟 ' :0.41239452275709515, ' 超越 ':0.39647241012049056, ' 英雄 ' : 
0.313110375266555513, ' 像 是 ' :0.30426828861337796, ' 跌 倒 ' :0.3625975500392993, ' 想 要 ' : 
0.5829550209468557,' 命运 ':0.7201128992940313, ' 变化 ':0.2686953866879604,' 天 空 ': 
0.3146976061015469, ' 父亲 ' :0.24636152229739733, ' 世 界 ':0.3565812143701714, ' 没 有 ': 
0.5977870162380065,' 人生 ':0.3775236250279759, ' 生活 ':0.2663673685783774, ' 改变 ': 
0.8023053505916324,' 穿 行 ' :0.30336139077497054, ' 海 洋 ' :0.28687650921373503, ' 追 逐 ' : 
0.28164694577079186, ' 拥 有 ' :0.5511676957186838, ' 太 阳 ' :0.31281001159455113, ' 知 道 ' : 
0.28305393123835487, ' 拍 拍 ':0.2877289851675474, "摇摆 ' :0.4813790823694424，' 力量" : 
0.5692829648461694, ' 翅 膀 ' :0.36632797341678375, ' 朋 友 ' :0.2528034375864833,' 挣 脱 ': 
0.39383738344839236, ' 奔跑 ':0.4640807450464461, ' 方 向 ' :0.4093246167577443, ' 就 算 ': 
0.9832790417761437, ' 水 手 ' :0.3471435439240663, ' 忘 记 ' :0.23862724809926258} 

image=Image.open('./tim.png') 

graph=np.array (image) 

wc=WordCloud (font path="'./fonts/simhei.ttf',background color='White', 

max words=50,mask=graph) 

wc.generate from frequencies (keywords) # 词 频 生成 词 云 

image color=ImageColorGenerator (graph) 

plt.imshow (wc) 

plt.imshow (wc.recolor (color func=image color)) 

plt.axis ("off") 

plt.show() 

wc.to file('dream.png') 


20.4 程序 设计 的 步骤 由 


@ 抓 取 网 页 数据 视频 讲解 
首先 要 对 网 页 进行 访问 ， 在 Python 中 使 用 的 是 urllib 库 ， 代 码 如 下 : 


from urllib import request 


resp=request .urlopen('https://movie.douban.com/nowplaying/hangzhou/') 
html data=resp.read() .decode ('utf-8') 


其 中 ,“https://movie.douban.comy/cinema/nowplaying/zhengzhou ”是 豆瓣 电影 最 新 上 映 的 上 
影 页 面 ， 用 户 可 以 在 浏览 器 中 输入 该 网 址 进行 查看 ; html data 是 字符 串 类 型 的 变量 ， 和 
存放 了 网 页 的 HTML 代码 。 输 入 print(html data) 可 以 查看 最 新 上 映 影 片 的 影讯 信息 ， 加 
图 20-6 所 示 。 

然后 对 得 到 的 HTML 代码 进行 解析 ， 提 取出 自己 需要 的 数据 。 在 Python 中 使 
BeautifulSoup 库 (如果 没有 则 使 用 pip install BeautifulSoup 进行 安装 ) 进行 HIML 代码 的 
解析 。 


[3 
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《<div id= nowplaying > 
<div class "mod-hd > 
<h23 正 在 上 映 《/h2> 


div> 


《div class="mod-bd’ > 
<ul class= “lists > 


《1 


i 生 "6390825” 

class=" list-item” 
data-title=“ 黑 鹏 " 
data-score="6.8" 

data-star=" 35" 
data-release="2018" 

dat a-duration=" | (中 国 大 陆 )” 


dat a-region= 
dz 出 rector=" 瑞 恩 * 库 格 勒 ” 

data-actors=" 查 德 维 克 " 博 斯 曼 / 露 皮 塔 * 尼 永 奥 / 迈克 尔 * B， 乔丹 “ 
data-category=" nowplaying” 

dat a-enough=" True” 

dat a-showed=" True” 

data-votecount="64156" 

data-subject="6390825” 


图 20-6 最 新 上 映 影 片 的 影讯 信息 


BeautifulSoup 使 用 的 格式 如 下 : 
BeautifulSoup (html, "html .parser") 


第 1 个 参数 为 需要 提取 数据 的 HIML， 第 2 个 参数 是 指定 解析 器 ， 然 后 使 用 find_all() 


读 取 HTML 中 的 内 容 。 


但 是 HTML 中 有 那么 多 的 标签 , 该 读 取 哪些 呢 ? 其 实 , 最 简单 的 办 法 是 打开 怜 取 网 页 
的 HTML 代码 ， 然 后 查看 需要 的 数据 在 哪个 HTML 标签 里 面 ， 如 图 20-6 所 示 。 


由 图 20-6 可 以 看 出 , 从 <div id=mowplaying> 标 签 开始 是 想 要 的 数据 ,里 面 有 电影 的 名 


你 、 评 分 、 主 演 等 信息 ， 所 以 相应 的 代码 编写 如 下 : 


from bs4 import 


BeautifulSoup as bs 


soup=bs (html data, 'htm1l.parser') 
nowplaying movie=soup.find all('dqiv'，idq='nowplaying'") 
nowplaying movie list=nowplaying movie[0] .find all('li', class = 


"ist-item') 


其 中 , nowplaying_movie_list 是 所 有 电影 信息 的 一 个 列表 , 可 以 用 print(nowplaying_movie_ 


list[1]) 查 看 第 2 部 影片 


| 本 


有 8 面 放 了 电影 的 名 字 ， 
网 页 时 需要 用 到 电影 的 


《红海 行动 》 的 内 容 ， 如 图 20-7 所 示 。 


从 该 图 中 可 以 看 到 在 data-subject 属性 里 面 放 了 电影 的 IJD 号 ,而 在 img 标签 的 alt 属性 


因此 通过 这 两 个 属性 来 得 到 电影 的 ID 和 名 称 〈 在 打开 电影 短评 的 


IJD， 所 以 需要 对 它 进行 解析 )， 编 写 代 码 如 下 : 


nowplaying list=[] 


for item in nowplaying movie list: 


nowplaying dict={} 坦 以 字典 形式 存储 每 部 电影 的 ID 和 名 称 
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nowplaying dict['id']=item['data-subject"'] 
for tag img item in item.find all('img'): 
nowplaying dict['name']=tag img item["alt'] 
nowplaying list.append (nowplaying dict) 
ii 中 “26861685" 


class=" list-item” 


datatitl=" 荐 潮 行 动 " 


data release="2018" 
data-duration=" 138 分 钟 “ 
"中 | 


dat svotecount="312987" 
data-subject="26861685” 


> 
ul class="") 
《Hi olass="poster’> 
¢a href="https://movie, douban. con/subject/26361685/ ?from=playing_poster” class-ticket-btn target=" blank” datepsource="poster") 
《ing src="https://ine3, doubanio, con/view/ photo/s ratio poster/public/02514119443, webn”alt=" 声 潮 行 动 ”rel=“nofollow” class="" /> 
/a 
ND 
Cli class="stitle" 
Ca href="https://novie. douban. com/subject/26861685/ From=playine_poster” 
cket-btn” 


dat a-psource="title”> 
刘 
</ay 
/1 


图 20-7 《红海 行动 》 电 影 信息 的 HTML 标签 


在 列表 nowplaying_list 中 存放 了 最 新 电影 的 ID 和 名 称 , 可 以 使 用 print(nowplaying_list) 
进行 查看 ， 结 果 如 下 : 


[{'id': '6390825'，'name': ' 黑 豹 '}，{'id': '26861685'，'name' : ' 红 海 行动 '}， 
{'id': '26698897'，'name': ' 唐 人 街 探 案 2'}，{'id': '26393561'，'name': ' 
小 萝 莉 的 猴 神 大 叔 '}，1{'id': '26649604'，'name' : ' 比 得 兔 '}，{'id': '26603666'，, 
'name' : ' 妈 妈 咪 鸭 '}，{'id': '30152451'，'name': ' 厉 害 了 ， 我 的 国 '}，{ "id' : 
'26972275'，'name': ' 恋 爱 回旋 '}，{'id': '26575103'，'name' : ' 捉 妖 记 2')， 
{'id': '27176717'，'name':' 能 出没- 变形 记 '}，{'id': '26611804'，'name': 
' 三 块 广告 牌 '}，{'iqd' : '25829175'，'name' : ' 西 游记 女儿 国 '},，{'id': '27085923'， 
"name' : ' 灵 魂 当 铺 之 时 间 典 当 '}，{ "id': '27114417'，'name' : "祖宗 十 九 代 '}， 
{'id': '25899334'， "name': ' 飞 岛 历 险 记 '}，{"id': '3036465'，'name': 
" 爱 在 记忆 消逝 前 '}，{'id': '27180882'，'name' : ' 疯 狂 的 公牛 '}, {'id': '25856453'， 
'name': ' 力 蜜 2'}，{'id': '26836837'， "name': "宇宙 有 爱 浪 漫 同 游 '}] 
可 以 看 到 是 和 豆瓣 网 址 上 面 匹配 的 ， 这 样 就 得 到 了 最 新 电影 的 信息 。 接 下 来 对 最 新 
影 短评 进行 分 析 。 例 如 《红海 行动 》 的 短评 网 址 为 “https://movie.douban.com/subject/ 
26861685/comments?start=0&limit=20”， 其 中 26861685 就 是 《红海 行动 》 电 影 的 ID, start=0 
表示 第 0 条 评论 。 
查看 上 面 的 短评 页 面 的 HIML 代码 ， 可 以 发 现 关 于 《红海 行动 》 评 论 的 数据 在 div 标 
签 的 comment 属性 下 面 ， 如 图 20-8 所 示 。 


此 
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div class="conment”> 


《apan lass="eomment-vote”》 
{epan class="votes")8801¢/span) 
《impat value="1323425806” type="hidden"/> 
a beefs"javaseript:;” class="j a_show 1ogin” onclicle"") 有 用 Ys> 
Yspany 
《span class=reopment-infor》 
a href"https: /wm douban con/people/ dremfox/ ”clsss=”)S 鸦 火 滞 4/ > 
《span) 看 过 span》 
《span class= "allstar40 ratine” title=" 推 荐 ">K/spsn> 
<span class="comnent-tine ” title="2018-02-13 15:35:16"> 
2018-02-13 


如 
全 lass=…>》 春节 档 最 好 最 好 下 是 战 集 而 是 战争 ， 有 点 类 似 黑 志 从 营 ， 主 旗 律 色彩 下 ， 真 实 又 天 本 的 战争 染 。 大事 性 不 强 ， 文 戏 不 超 20 分 钟 ， 从 头 打 到 尾 ， 林 超员 场面 风度 栅 
佳 ， 埠 战 、 es 突击 有 条 不 紊 ， 军 械 武器 展示 效果 不 模 。 尺 度 超大 ， 负 渴 崔 式 血肉 福 飞 ， 还 给 你 看 特写 ! 敌人 如 表 尸 一 般 打 不 完 ， 双方 的 狙击 手 都 是 亮点 


图 20-8 《红海 行动 》 短 评 信息 的 HIML 标签 


因此 对 该 标签 进行 解析 ， 代 码 如 下 : 


requrl='https://movie.douban.com/subject/' + nowplaying list[0]['id'] + 
'/comments' +'?' +'start=0' + '&limit=20"' 

resp=request .urlopen (requrl) 

html data=resp.read() .decode ('utf-8') 

soup=bs (html data, 'html .parser') 


comment div lits=soup.find all('div', class ='comment') 


此 时 在 comment_div_lits 列表 中 存放 的 就 是 class ='comment' 的 所 有 div 标签 里 面 的 HIML 
代码 了 。 在 图 20-8 中 还 可 以 发 现 <div class_='comment> 标 签 里 面 的 p 标签 下 面 存放 了 网 友 
对 电影 的 评论 ， 因 此 对 comment div_lits 代码 中 的 HTML 代码 继续 进行 解析 ， 代 码 如 下 : 


eachCommentList=[]; 


for item in comment div lits: 
if item.find all('p') [0] .string is not None: 
eachCommentList.append (item.find all('p') [0] .string) 


使 用 print(eachCommentList) 查 看 eachCommentList 列表 中 的 内 容 ， 可 以 看 到 里 面 存放 
了 大 家 想 要 的 影评 。 

至 此 已 经 息 取 了 豆 辩 电影 最 近 播 放电 影 的 评论 数据 ， 接 下 来 就 要 对 数据 进行 清洗 和 词 
云 显示 了 。 

@ 数据 清洗 

数据 清洗 是 消去 与 数据 分 析 无 关 的 信息 ， 这 里 为 了 方便 进行 数据 清洗 ， 将 列表 中 的 数 
据 放 在 一 个 字符 串 中 ， 代 码 如 下 : 


comments="" 


for k in range(len(eachCommentList)): 
comments=comments + (str (eachCommentList[k])) .strip() 


使 用 print(comments) 进 行 查看 ， 可 以 看 到 所 有 的 评论 已 经 变 成 一 个 字符 串 ， 但 是 评论 
中 还 有 很 多 标点 符号 等 。 这 些 符号 对 词 频 统计 根本 没 用 ， 因 此 要 将 它们 清除 ， 所 用 的 方法 
是 使 用 正则 表达 式 ，Python 中 的 正则 表达 式 是 通过 re 模块 实现 的 。 其 代码 如 下 : 
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import re 
pattern=re.compile(r'[\u4e00-\u9fa5]+"') 
filterdata=re.findall (pattern, comments) 


cleaned comments="''.join(filterdata) 


继续 使 用 print (cleaned_comments) 语句 进行 查看 ， 可 以 看 到 此 时 评论 数据 中 已 经 没 
有 那些 标点 符号 了 ， 数 据 被 清 “干净 ”了 。 
因为 要 进行 词 频 统 计 ， 所 以 先进 行 中 文 分 词 操作 。 在 这 里 使 用 的 是 jieba 分 词 ， 如 果 用 
户 没有 安装 jieba 分 词 ， 可 以 在 控制 台 使 用 pip install jieba 进行 安装 (可 以 使 用 pip list 查看 
是 否 安装 了 这 些 库 )。 中 文 分 词 的 代码 如 下 : 

import jieba.analyse # 分 词 包 

# 使 用 jieba 分 词 进行 中 文 分 词 


result=jieba.analyse.textrank (cleaned comments,topK=50,withWeight=True) 


keywords=dict () 
for i in result: 

keywords [i[0]]=i[1] 
print ("删除 停 用 词 前 ", keywords) 


结果 如 下 : 


{' 大 片 ': 0.28764823530539835，' 动 作 ' : 0.42333889433557714， ' 人 质 ' : 
0.18041389646505365，' 不 能 ' : 0.18403284248005652，' 行 动 ': 
0.5258110409848542,' 的 ': 0.19000741337241692，' 看 到 ' : 0.16410604936619055， 
' 太 ': 0.250308587701313， ' 导 演 ': 0.3247672024874971， ' 军 人 ' : 
0.22827987403008904， ' 主 旋律 ': 0.21300534948534544，' 电 影 ': 1.0，' 作 战 ' : 
0.17912699218043704， ' 震 撼 ': 0.24439586499277743， ' 国 产 ' : 
0.37209344994813087，' 人 物 ': 0.3211015399811397，' 红 海 ': 0.2759713023909607， 
' 有 点 ': 0.19442262680122022， ' 节 奏 ': 0.28504415161934643， ' 战 争 片 ' : 
0.305141973888238，' 战 争 ': 0.38941165361568963，' 爆 破 ': 0.17280424905747072， 
"演员 ' : 0.18291268026465418， ' 全 程 ': 0.1812416074586381， ' 湄 公 河 ' : 
0.4937422787186316，' 还 有 ' : 0.17809860837238478，' 个 人 ' : 0.2610284731772877， 
" 黑 座 坠落 ' : 0.21305500057787405， ' 剧 情 ': 0.21982545428026873， ' 战 狼 ' : 
0.611947562855697，' 从 头 ': 0.21612064060347713，' 文 戏 ' : 0.38037163533740115， 
"军事 ': 0.39830147699101087， ' 好 看 ': 0.1843800611024451， ' 觉 得 ' : 
0.18438026420714343，' 坦 克 ' : 0.2103294696884718，' 海 军 ': 0.2780877491487478， 
' 黄 景 ' : 0.2762848729539791，' 喜 欢 ': 0.186512622392206，' 好 莱 坞 ': 
0.3041242625437134，' 狙 击 手 ' : 0.4529383170599891,…} 


从 结果 可 以 看 到 进行 词 频 统计 了 ， 但 数据 中 还 有 “ 太 ”“ 的 ”等 虚词 ( 停 用 词 )， 这 些 
词 在 任何 场景 中 都 是 高 频 词 ， 并 且 没 有 实际 的 含义 ， 所 以 要 把 它们 清除 。 

本 程序 把 停 用 词 放 在 一 个 名 为 stopwords.txt 的 文件 中 ,将 数据 与 停 用 词 进行 比 对 即 可 。 
删除 停 用 词 的 代码 如 下 : 

keywords={x:keywords[x] for x in keywords if x not in stopwords} 

print ("删除 停 用 词 后 ", keywords) 
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卖 使 用 print0 语 句 查 看 结果 ， 可 见 停 用 词 已 经 被 清除 了 。 
于 前 面 只 是 疏 取 了 第 1 页 的 评论 ， 所 以 数据 有 点 少 ， 在 最 后 给 出 的 完整 代码 


UD 


扑 取 


了 10 页 的 评论 ， 所 得 数据 比较 有 参考 价值 。 


人 @ 用 间 云 进行 显示 


import matplotlib.pyplot 
import matplotlib 


as plt 


matplotlib.rcParams['figure.figsize']=(10.0, 5.0) 


from wordcloud import Wo 


rdcloud # 词 云 包 


# 指 定 字 体 类 型 、 字 体 大 小 和 字体 颜色 


wordcloud=Wordcloud (font 
max font size=80,stopwor 
word frequence=keywords 
myword=wordcloud.fit wor 
plt.imshow (myword) 
plt.axis ("off") 
plt.show() 


其 中 ，simhei.ttf 用 来 指定 字体 ， 月 


_path="simhei.ttf",background color="white", 
ds=stopwords) 


ds (word frequence) 


# 展 示 词 云 图 


目 户 可 以 在 百度 上 输入 simhei.ttf 进行 下 载 ,然后 放 入 程序 


的 根 目 录 中 。 
完整 的 程序 代码 如 下 : 


import warnings 
warnings.filterwarnings( 
import jieba 

import jieba.analyse 
import numpy 

import re 

import matplotlib.pyplot 
from urllib import reque. 
from bs4 import Beautifu 
import matplotlib 


"ignore") 
# 分 词 包 
#numpy 计算 包 
EE 
SE 


lSoup as bs 


matplotlib.rcParams['figure.figsize']=(10.0, 5.0) 


from wordcloud import Wo 
# 分 析 网 页 函数 
def getNowPlayingMovie 1 


rdcloud # 词 云 包 


dst(t) 


resp=request .urlopen ('https://movie.douban.com/nowplaying/ 


zhengzhou/') 
html data=resp.read() 


-decode ('utf-8') 


soup=bs (html data, ‘html .parser') 


nowplaying movie=soup.find all('div', id='nowplaying') 


nowplaying movie list=nowplaying movie[0] .find alll('li', class = 


'list-item'’) 


nowplaying list=[] 


for item in nowplaying movie list: 
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nowplaying dict={} 
nowplaying dict['id']=item['"'data-subject"] 
for tag img item in item.find all('img'): 
nowplaying dict['name']=tag img item["alt'"] 
nowplaying list.append (nowplaying dict) 
return nowplaying list 


# 胞 取 评论 函数 
def getCommentsById (movieId，pageNum) : 间 参 数 为 电影 id 号 和 要 有 息 取 评论 的 页 码 


eachCommentList=[]; 
if pageNum>0: 
start= (pageNum-1)*20 
SLSe: 
return False 
requrl='https://movie.douban.com/subject/' + movieId + '/comments' 
"2 T'stadrt=" $F gtr{(starct) + "limit=20° 
print (requrl) 
resp=request .urlopen (requrl) 
html data=resp.read() .decode ('utf-8') 
soup=bs (html data, 'html .parser') 
comment div lits=soup.find alll('div', class ='comment') 
for item in comment div lits: 
if item.find all('p') [0] .string is not None: 
eachCommentList.append (item.find all('p') [0] .string) 
return eachCommentList 


def main() : 


# 循 环 获取 第 2 个 电影 的 前 10 页 评论 
commentList=[] 
NowPlayingMovie list=getNowPlayingMovie list() 
for i in range(10): ## 前 10 页 
num=i + 1 
commentList temp=getCommentsById (NowPlayingMovie list[1]['id'] 
num) # 指 定 哪 部 电影 。 因 为 索引 号 从 0 开始 ， 所 以 是 第 2 个 电影 。numb 是 爬 取 哪 一 页 评论 
commentList .append (commentList temp) 
# 将 列表 中 的 数据 转换 为 字符 串 
comments="" 
for k in range (len (CommentList) ) : 
comments=comments+(str (CommentList[k])) .strip() 
# 使 用 正则 表达 式 去 掉 标 点 符号 
pattern=re.compile(r'[\u4e00-\u9fa5]+"') 
filterdata=re.findall (pattern, comments) 
cleaned comments="''.join(filterdata) 
# 使 用 jieba 分 词 进行 中 文 分 词 
result=jieba.analyse.textrank (cleaned comments,topK=50, 
withWeight=True) 
keywords=dict () 
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for i in result: 

keywords [i[0]]=i[1] 
print ("删除 停 用 词 前 ", keywords) #{ "演员 ' :0.18290354231824632, ' 大 片 ' : 

#0.2876433001472282} 

# 停 用 词 集合 
stopwords=set (STOPWORDS) 
f=open('./StopWords.txt',encoding="utf8") 
while True: 

word=f.readline() 

if word=="": 

break 

stopwords.add (word[:-1]) 
print (stopwords) 
keywords={x:keywords[x] for x in keywords if x not in stopwords} 
print ("删除 停 用 词 后 ", keywords) 
# 用 词 云 进行 显示 
wordcloud=WordCloud (font path="simhei.ttf",background color="white", 


max font size=80,stopwords=stopwords) 


word frequence=keywords 

myword=wordcloud.fit words (word frequence) 
plt.imshow (myword) # 展 示 词 云图 
pl axris ("orfE"} 

plt.show() 


# 主 函数 


main() 


程序 运行 后 显示 的 图 像 如 图 20-9 所 示 。 
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图 20-9 词 云 显示 结果 
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